O big data unido à inteligência artificial tem transformado os bioprocessos e facilitado a obtenção de produtos de qualidade.

Nos últimos anos, o termo “big data” ganhou muito destaque, principalmente nas áreas que envolvem tecnologia. Apesar da recente popularidade, o emprego de big data é bastante antigo, e um exemplo é o uso de máquinas para decifrar códigos nazistas durante a Segunda Guerra Mundial. Na Biotecnologia, não é diferente. A geração de volumes de dados cada vez maiores nos diversos subcampos da biotecnologia tornou essencial o uso de big data para a obtenção de informações a partir das bases de dados existentes.

Big Data

O termo “big data”, em tradução livre para o português, significa “grandes dados”. É definido como uma área que estuda como tratar, analisar, plotar e obter informações a partir de um grande conjunto de dados (megadados) que não podem ser gerenciados por métodos convencionais de análise. Os conjuntos de dados são cada vez maiores e mais complexos, além de apresentarem grande variedade em tipos de dados a serem coletados e transferidos em elevada velocidade. Dessa forma, as principais características do big data são conhecidas como os 3 Vs: volume, velocidade e variedade.

  • Volume: o volume de dados cresce exponencialmente em diversas áreas, pois as organizações estão sempre coletando dados de diversas fontes como transações, redes sociais, equipamentos industriais, IoT (internet of things) e muitas outras. Esses dados precisam ser armazenados para as etapas posteriores, e o uso de bancos de dados e armazenamento em nuvem reduziram os custos de armazenamento.
  • Velocidade: a velocidade de coleta, transferência e armazenamento dos dados precisa ser altíssima e proporcional ao volume de dados, para evitar riscos e prejuízos no gerenciamento das informações.
  • Variedade: os dados disponíveis provêm de diferentes origens e apresentam formatos distintos e diversos tipos: estruturados, não estruturados e semiestruturados. 

A principal forma de trabalhar com esses grandes e diversos volumes de dados do big data é a partir do uso de NoSQL (Not Only Structured Query Language, não apenas linguagem de consulta estruturada), que são bancos de dados não relacionais, ou seja, não exigem que os dados sejam estruturados em uma tabela, com linhas e colunas pré-definidas. Os bancos de dados NoSQL permitem que os dados sejam armazenados e estruturados em uma variedade de modelos, o que é uma vantagem para trabalhar com dados de big data. Além disso, possuem alguns benefícios como a flexibilidade para trabalhar com diferentes tipos de dados, a escalabilidade devido ao uso da computação em nuvem para armazenamento e processamento e alta performance, visto que são otimizados para modelos de dados específicos. Além disso, o uso de NoSQL combinado com a computação em nuvem permite que o usuário utilize máquinas com menor performance, visto que o esforço computacional de processamento é realizado por servidores remotos.

O uso do big data, de forma breve e generalista, gera informações úteis para as organizações. Alguns exemplos são: (i) aprendizado sobre o comportamento de consumo dos usuários, com a possibilidade de prever e propor ofertas personalizadas e otimizar o direcionamento de marketing para seus clientes; (ii) uso por órgãos governamentais para administrar dados da população, como é o caso do gerenciamento do programa Bolsa Família (agora Auxilio Brasil), no Brasil; (iii) aumento da eficiência operacional na indústria de manufatura; (iv) detecção e prevenção de fraudes; (v) controle de qualidade na produção e manutenção preditiva de peças e equipamentos; e (vi) desenvolvimento de novos produtos.

Além desses usos, o big data é de extrema importância para o desenvolvimento de aplicações eficientes de inteligência artificial (IA) e machine learning (ML), subcampo da IA. Modelos matemáticos que utilizam essas aplicações necessitam de treinamento extensivo para que o algoritmo seja capaz de aprender e realizar a tomada de decisão assertiva. O enorme volume de dados do big data serve para o treinamento dos modelos, sendo essencial para o desenvolvimento de campos que utilizam IA.

Big Data em Biotecnologia

Sendo uma área baseada em tecnologia, a Biotecnologia também faz uso de big data para diversas aplicações que têm se destacado nos últimos anos. Com o avanço de diversas técnicas de biologia molecular e proteômica, o volume de dados biológicos depositados em bancos de dados cresce desmesuradamente. Em 2014, por exemplo, apenas um dos repositórios que compõem o Instituto de Bioinformática Europeu (EBI) tinha mais de 40 petabytes (1015 bytes) de dados armazenados.

A indústria farmacêutica é uma das que mais se beneficia do uso de big data, pois é a partir dos dados disponíveis que se torna possível a pesquisa e descoberta de novos fármacos in silico, bem como a melhoria da tomada de decisão sobre diagnósticos e tratamentos por médicos e pacientes. Além disso, o enorme volume de dados de expressão gênica em diversas condições e de vários organismos permite encontrar padrões e informações que podem ser utilizados na identificação de uma gama de doenças.

Um exemplo desse tipo de aplicação é o MammaPrint®, uma ferramenta de machine learning aprovada pelo U.S. Food and Drug Administration (FDA) que realiza teste de prognóstico para câncer de mama baseado em 70 assinaturas genéticas provindas de análises de microarray. A partir de amostras biológicas do tumor e da análise do perfil genético do mesmo, o MammaPrint® determina quão agressivo é o tumor e o risco de recorrência do câncer de mama em um período de 10 anos, o que leva a avaliação da necessidade do tratamento com quimioterapia. Além dessa, aplicações utilizando IA que analisam imagens de mamografia e identificam padrões de pequenas lesões também estão se tornando mais precisas para auxiliar no diagnóstico de câncer de mama, até 5 anos antes do aparecimento do tumor.

Big Data em Bioprocessos

De forma generalista, um bioprocesso consiste na produção de materiais com valor comercial a partir de fontes vivas, geralmente células ou componentes celulares como as enzimas, vírus ou organismos inteiros, que são responsivas ao ambiente controlado. Os produtos produzidos a partir dos bioprocessos se inserem num vasto leque de subcampos, como é o caso da produção de medicamentos, biocombustíveis, cervejas e muitos outros.

O desenvolvimento de um bioprocesso ocorre em algumas etapas, e os biorreatores são equipamentos essenciais para isso. Para que o produto seja obtido em quantidade e com qualidade, parâmetros essenciais precisam ser analisados a todo momento, por meio de sensores componentes dos biorreatores, e mantidos estáveis ao longo do bioprocesso. Exemplos desses parâmetros são: pH, temperatura, pressão e agitação, além de muitos outros, que são ajustados de acordo com cada bioprocesso.

Fluxograma das etapas essenciais de um bioprocesso.
Fluxograma das etapas essenciais de um bioprocesso. Fonte: Clapp, Castan e Lindskog, 2018. #PraTodosVerem: os processos em verde correspondem à etapa de upstream, que é caracterizada por atividades que ocorrem antes da coleta do bioproduto, como a hidratação e filtração do meio de cultura, seguidas da esterilização e do processo de produção no biorreator. O processo em rosa corresponde à coleta do produto, e os processos em laranja correspondem à etapa de downstream, que envolve os tratamentos necessários para a separação e finalização do produto, até chegar ao comércio. A etapa de downstream é a parte mais onerosa de um bioprocesso e é composta pela separação e filtração do produto, seguida da finalização e envase. 

Para que um bioprocesso ocorra de forma adequada, dados precisam ser coletados  frequentemente  para que a manutenção correta dos parâmetros seja feita e que o produto com a qualidade desejada seja obtido. E é nessa brecha que o big data se encaixa nos bioprocessos, principalmente em nível industrial. Com isso, o uso de modelos e aplicações estatísticas, mecanísticas, de IA e ML e modelos híbridos para analisar as informações do big data tem crescido exponencialmente nos últimos anos (para entender melhor sobre essas aplicações, leia este artigo em inglês).

O big data, em bioprocessos, pode ser utilizado no processamento de dados da etapa de upstream, do histórico das bateladas e da etapa de downstream, além do processamento e análise interativa de dados. Alguns dos benefícios de usar métodos de big data nessa área são: (i) integração de dados upstreamdownstream; (ii) melhor qualidade do produto; (iii) minimização do desperdício; (iv) previsão de falhas; (v) monitoramento remoto e manutenção preditiva, e (vi) agendamento de manutenções de forma otimizada.

Nesse contexto, a plataforma de software eve®, da INFORS HT, tem se destacado no cenário atual. Essa plataforma apresenta características fundamentais para controlar, analisar e integrar as informações e dados dos bioprocessos em um único lugar, com uma interface de usuário amigável e baseada em navegador. Dependendo do pacote assinado, a plataforma pode (i) apenas monitorar os bioprocessos, (ii) controlá-los e automatizá-los ou, ainda, (iii) oferecer um ambiente com validação do software de acordo com as normas de regulamentação vigentes (FDA CFR 21 Parte 11), etapa que é crucial para a indústria farmacêutica, mas que também beneficia outros ramos industriais. 

A plataforma eve® oferece monitoramento moderno e em tempo real dos processos, controle eficiente e estratégico de bateladas, análise de dados por meio de sensores virtuais (sensores de software) integrados e integração com softwares de terceiros (exemplo: Matlab e SCADA). Também permite gerar  relatórios e realizar a gestão de dados, com a possibilidade de exportação de arquivos em formatos editáveis e de integração de todos os processos e equipamentos que compõem o bioprocesso, tudo isso utilizando tecnologia NoSQL para bancos de dados. Devido às tecnologias utilizadas para a construção da eve®, principalmente o NoSQL, ela pode ser acessada e controlada de forma inteiramente remota e sem grande esforço computacional, através dos navegadores de internet (Chrome, Firefox, Safari e outros) disponíveis para computadores e celulares.

Como visto, o avanço do Big Data traz muitas facilidades e otimização de processos para indústrias e organizações dos mais diversos segmentos, inclusive para a Biotecnológica. É através do uso combinado de aplicações de IA para tratar Big Data e assim aprender com os padrões presentes nessas informações, que a biotecnologia tem auxiliado no diagnóstico de precisão de doenças, como o câncer de mama.

Por fim, é importante destacar que o uso de softwares para a integração e controle de bioprocessos é uma vantagem para obter produtos de qualidade e com redução de gastos para a indústria, uma vez que é capaz de prever erros e adiantar a manutenção dos equipamentos. Ademais, o crescente uso do big data e de tecnologias baseadas em IA tem colaborado para a evolução cada vez mais assertiva dos softwares para bioprocessos, gerando bons resultados para a indústria e para os consumidores.

Perfil de Darling Lourenço
Texto revisado por Elaine Latocheski e Natália Videira

Texto produzido em parceria com a INFORS HT.

Cite este artigo:
LOURENÇO, D. A. Big Data em Biotecnologia: como transformar dados brutos em inteligência. Revista Blog do Profissão Biotec, v.10, 2023. Disponível em: <https://profissaobiotec.com.br/big-data-em-biotecnologia-como-transformar-dados-brutos-inteligencia/>. Acesso em: dd/mm/aaaa.

Referências

BIG Data: o que é, para que serve, como aplicar e exemplos. Blog do EAD UCS. Disponível em: <https://ead.ucs.br/blog/big-data>. Acesso em: 29 Jun 2022.
BIG Data – What it is and why it matters. SAS. Disponível em: <https://www.sas.com/pt_br/insights/big-data/what-is-big-data.html>. Acesso em: 29 Jun 2022.
CARDOSO, F. et al. 70-gene signature as an aid to treatment decisions in early-stage breast cancer. N. Engl. J. Med, v. 375, p. 717–729, 2016.
CLAPP, K. P.; CASTAN, A.; LINDSKOG, E. K. Upstream Processing Equipment. Biopharmaceutical Processing: Development, Design, and Implementation of Manufacturing Processes, p. 457–476, 2018. doi: https://doi.org/10.1016/B978-0-08-100623-8.00024-4.
COSSAR, D. Bioprocessing Techniques. Comprehensive Biotechnology, Second Edition, v. 1, p. 679–690, 2011. doi: https://doi.org/10.1016/B978-0-08-088504-9.00078-7.
EVE – A plataforma de software para bioprocessos. INFORS HT. Disponível em: < https://www.infors-ht.com/pt/software-para-bioprocessos/eve-bioprocess-software-15/>. Acesso em: 01 Jul 2022.
KLASENER, I. C. Biorreatores: você sabe como eles funcionam?. Blog do Profissão Biotec, v. 3, 2018. Disponível em: <https://profissaobiotec.com.br/biorreatores-como-eles-funcionam/>. Acesso em: 01 Jul 2022.
MONTGOMERY, S. A., GRAHAM, L. J. Big Biotech Data: Implementing Large-Scale Data Processing and Analysis for Bioprocessing. BioProcess International. Disponível em: <https://bioprocessintl.com/manufacturing/information-technology/big-biotech-data-implementing-large-scale-data-processing-and-analysis-for-bioprocessing/>. Acesso em: 01 Jul 2022. 
MUENZ, R. A brief overview of bioprocessing. LabManager. Disponível em: <https://www.labmanager.com/big-picture/bioprocessing-overview-and-trends/a-brief-overview-of-bioprocessing-25962>. Acesso em: 30 Jun 2022.
O que é Big Data? Oracle. Disponível em: <https://www.oracle.com/br/big-data/what-is-big-data/>. Acesso em: 29 Jun 2022.
O que é NoSQL? Oracle OCI. Disponível em: <https://www.oracle.com/br/database/nosql/what-is-nosql>. Acesso em 30 Ago 2022.
O que são bancos de dados NoSQL. AWS. Disponível em: <https://aws.amazon.com/pt/nosql/>. Acesso em: 30 Ago 2022.
POKHRIYAL, P. et al. Using Modeling to Improve Data Analytics for Upstream Bioprocessing Workflows. BP Elements, v. 1, n. 2, 2022. Disponível em: <https://www.biopharminternational.com/view/using-modeling-to-improve-data-analytics-for-upstream-bioprocessing-workflows>. Acesso em: 01 Jul 2022.
PORQUE Big Data É Crucial Para A Indústria Farmacêutica. Engine. Disponível em: <https://enginebr.com.br/big-data-crucial-industria-farmaceutica/>. Acesso em: 29 Jun 2022.
RAPER, V. Bioprocessing warms to artificial intelligence. Genetic Engineering and Biotechnology News. Disponível em: <https://www.genengnews.com/insights/bioprocessing-warms-to-artificial-intelligence/>. Acesso em: 27 Jun 2022.
REDATOR Rock Content. Big Data: entenda o conceito, suas aplicações em diferentes contextos e como impacta as iniciativas de Marketing. Rock Content Blog. Disponível em: <https://rockcontent.com/br/blog/big-data/>. Acesso em: 29 Jun 2022.
REZENDE, S. B. Big Data: com grandes quantidades de dados vem grandes responsabilidades. Revista Blog do Profissão Biotec, v.9, 2022. Disponível em: <https://profissaobiotec.com.br/big-data-com-grandes-quantidades-de-dados-vemgrandes-responsabilidades/>. Acesso em: 29 Jun 2022.
THOMS, J.F. Bioprocessos em detalhes: do laboratório à indústria. Blog do Profissão Biotec, v.7., abril/2021. Disponível em: <www.profissabobiotec.com.br/bioprocessos-em-detalhes-do-laboratorio-a-industria>. Acesso em: 27 Jun 2022.
Fonte da imagem destacada: Imagem do catálogo da INFORS HT.

Sobre Nós

O Profissão Biotec é um coletivo de pessoas com um só propósito: apresentar o profissional de biotecnologia ao mundo. Somos formados por profissionais e estudantes voluntários atuantes nos diferentes ramos da biotecnologia em todos os cantos do Brasil e até mesmo espalhados pelo mundo.

Recentes

Assine nossa newsletter

Ao clicar no botão, você está aceitando receber nossas comunicações.