Pular para o conteúdo

Strain Databases & StrainCatalog

FonteVolumeLicençaDadosfonte_do_dado
strain-database51.700+ strains, 1.820+ breeders, 35.800+ relações genéticasOpen accessGenética, linhagem, breeders, UUIDsstrain-database/github
Kushy Dataset~2.000 strains + produtos/marcas/lojasMITStrain, tipo, efeitos, sabores, lab resultskushy/github
cannabis.csv (Kaggle)~2.350 strainsOpen dataNome, tipo, rating, efeitos, sabores (scrape Leafly)kaggle/cannabis-csv
OpenTHC/vdbMenor, IDs padronizadosGPL-3.0UUIDs interop entre sistemas cannabisopenthc/vdb
CannlyticsLab results vários estados USMITTHC, CBD, terpenos, resultados analíticos reaiscannlytics/github
API 43k strains (2026)43.000+Freemium (100 req/dia)Efeitos, terpenos %, canabinoides, condições médicas, linhagemcannabis-reports-api
Mendeley Dataset800+Open (DOI)Perfis subjetivos × composição químicamendeley/doi

GPL-3.0 (OpenTHC/vdb) compatível com AGPL do core canna-br. MIT (Kushy, Cannlytics) sem atrito. Registrar fonte_do_dado por linha = compliance de atribuição.


TouchpointPapel do StrainCatalog
Chain of Custodystrain_id canônico em cultivation_batch — identidade da variedade semente→dispensação. Sem ID consistente, auditoria de rastreabilidade por variedade é impossível.
SNGPCMovimentação registrada por produto; ID aberto evita divergência de nomenclatura entre associações no mesmo lote de submissão.
RDC 1.014/2026Rastreabilidade por variedade exigida; catálogo de referência = evidência de processo pra ANVISA.
Agente AI (Mel)Perfis canabinoides/terpenos = base de recomendação personalizada ao associado via MCP.

StrainCatalog (bounded context separado do ledger)
├── strain_id UUID, base OpenTHC/vdb — chave de interop
├── nome_comum ex: "Charlotte's Web"
├── nome_científico ex: Cannabis sativa L.
├── tipo indica | sativa | hybrid | cbd
├── canabinoides THC%, CBD%, CBG% (quando disponível)
├── terpenos perfil (quando disponível)
├── linhagem parent strains (refs por strain_id)
└── fonte_do_dado auditoria da origem (ver tabela acima)
Consumidores (leitura apenas):
Chain of Custody ──► strain_id em cultivation_batch
SNGPC adapter ──► nome canônico por strain_id
Agente AI (Mel) ──► canabinoides + terpenos pra recomendação

Nunca acoplado à contabilidade. Nunca recebe events do ledger. Expõe apenas leitura.


Não criar do zero. Estratégia de seed:

  1. OpenTHC/vdb — UUIDs de interop. Base do strain_id canônico.
  2. Kushy — efeitos + lab results + tipos (MIT, sem atrito).
  3. strain-database — linhagem genética quando associações cultivarem variedades próprias (51k+ strains, breeders, relações).

Posicionamento: primeiro catálogo de strains com foco medicinal e regulatório BR — diferencial de produto + argumento de confiança junto à ANVISA.


Datasets majoritariamente recreacionais US (Leafly/Weedmaps scrapes). Contexto medicinal BR sob RDC 1.014 é diferente: perfis de uso, condições médicas e concentrações relevantes divergem do mercado recreacional. Curadoria medicinal BR é o trabalho real — e o diferencial competitivo.


Ver Roadmap — entrada no Ideas Park com gatilho explícito: implementação do Chain of Custody OU primeira associação piloto cultivando variedade própria. Não prioriza sobre minors em curso.