Divulgação

Laboratório Multiusuários, um apoio aos pesquisadores do INEU

Crédito: Tatiana Carlotti

Por Victor Farinelli [Informe OPEU] [Divulgação]

Durante o Encontro Anual do Instituto Nacional de Estudos sobre os Estados Unidos (INCT-INEU), houve uma sessão inteiramente focada nos trabalhos e projetos dos pesquisadores da rede, realizado no dia 3 de dezembro. 

Entre elas, uma discussão sobre o Laboratório Multiusuários do Instituto de Políticas Públicas e Relações Internacionais (IPPRI), desenvolvido pelo professor Marcelo Passini Mariano e pelo pesquisador Rafael Almeida, ambos da Universidade Estadual Paulista (Unesp). 

Com moderação Pedro Henrique Vasques (Unicamp e Cedec) e comentários do professor Andrei Koerner (Unicamp e IBCCRIM), eles apresentaram as potencialidades e os diversos usos do Laboratório Multiusuários para os pesquisadores em Ciências Humanas e Sociais.  

O objetivo do Laboratório é entregar um suporte tecnológico, capaz de capturar, organizar e analisar dados com uma maior capacidade de processamento e em quantidades superiores de dados das obtidas em pesquisas individuais ou de pequenos grupos.  

O Laboratório está focado na “concepção de e-science, principalmente, com a proposta que a própria FAPESP vem apresentando há alguns anos, cujo pilar é a infraestrutura computacional”, explicou Mariano, acrescentando que eles seguem uma política de dados abertos”. 

Certas vezes, ponderou o pesquisador, as pesquisas que usam o Laboratório seguem políticas que, não necessariamente, se casam com esse modelo. Isso, no entanto, não é um problema. “Nós privilegiamos o open source, recursos computacionais, serviços ou softwares que sejam os mais abertos”, afirmou.  

Mariano também relatou que o Laboratório Multiusuários tem interconexão com uma infraestrutura computacional em expansão no Centro de Pesquisa Política e Social da Unesp, em Franca. “Os dois núcleos são interligados, do ponto de vista tecnológico”. 

O professor lembrou que os novos investimentos no projeto servirão para “capacitar a infraestrutura para rodar melhor os modelos de aprendizado de máquina ou modelos de linguagem de inteligência artificial gerativa, e para expandir o acesso remoto”. 

Usos do Laboratório 

Ao demostrar as possibilidades de uso do Laboratório, o pesquisador Rafael Almeida apresentou a hemeroteca micrométrica externa da Unesp, com base em recortes de jornais digitalizados no CEDEC, do acervo organizado pelo professor Tullo Vigevani. 

São mais de 38 mil dados, pouco menos de 40 mil arquivos, todos já indexados no sistema. Almeida relatou que a parte de processamento, organização e indexação em linguagem correta, está bem desenvolvida no Laboratório. “É um produto que já existe”, salientou. 

“Esse produto pode ser replicado para livros e qualquer outra coisa; pode estar aberto ou controlado” e, no caso da hemeroteca, encontra-se aberto na internet. “É uma máquina que a gente desenvolveu e está rodando dentro da Unesp (de Franca)”, salientou. 

O professor Mariano destacou que Almeida fez um trabalho crucial no desenvolvimento desta máquina virtual para a hemeroteca, frisando que ela poderá ser reproduzida para “qualquer outra coleção de dados e da mesma forma”. 

Almeida também demonstrou um outro projeto do Laboratório relativo a um acervo sobre a educação na América Latina. “É o mesmo esquema; você consulta por ‘educação’ e ele vai colocar esses arquivos à disposição”, afirmou, ao garantir que o mesmo sistema, chamado SEACAM, pode ser realizado para construir uma biblioteca do INEU.  

“A gente começou, faz pouco tempo, a inserir algumas das bases dos nossos dados nele. Neste momento, ele só está disponível dentro da VPN da Unesp”, destacou Almeida. 

Armazenamento e administração de dados 

Sobre a questão dos dados, Mariano ressaltou que, atualmente, existe muita informação de diversas formas. Neste sentido, o sistema permite, com facilidade, trabalhar textos e dados com quantidades muito grandes de informação. Isso tudo é possível com a inteligência artificial generativa, afirmou. 

“Quando falamos de arquivos de mais pesados, com áudio, imagem e vídeo, também é possível fazer”, garantiu, ao acrescentar que, cada vez mais, as pesquisas terão demandas multimídias. “Isso vai aumentar”, destacou, afirmando que se houver demanda suficiente também poderá ser utilizada uma IA generativa mais específica”.  

Ele informou, ainda, que a base de dados permite o armazenamento de milhões de arquivos, incluindo livros, revistas, artigos científicos e jornalísticos, reportagens e outros materiais. “Todo esse conteúdo poder ser segmentado em temas específicos”. 

“Se o pesquisador quiser buscar na base de revistas sobre Relações Internacionais, por exemplo, ele poderá pesquisar; se quiser pegar algo no Diário Oficial da União, terá também. E se quiser pesquisar na própria base que sua equipe de pesquisa está construindo, também é possível”, assegurou.  

Uma possibilidade que o sistema permite, destacou o pesquisador, é a criação de uma base de dados de todos os livros publicados pelo INEU, com tudo o que já foi digitalizado, a partir de uma interface avançada.  

Mariano também destacou o caráter colaborativo do sistema. “Quando os dados vêm de uma pesquisa, nós sempre tentamos fazer uma articulação para que eles também sirvam para pesquisas futuras. Essa é a lógica que implementamos. Por isso, temos um volume grande de dados prontos”, afirmou. 

Ele destacou que a parte da colaboração é interessante, “porque se tem uma demanda nova de sites governamentais ou de grupos que estão sendo estudados nos Estados Unidos, ou mesmo de jornais norte-americanos, as pesquisas não partem do zero”.  

E acrescentou: “nós fazemos ajustes, temos um conjunto de bibliotecas mais ou menos prontas, permitindo que o tempo para fazer esse tipo de coleta seja bem mais reduzido”.  

Em sua avaliação, “hoje está muito mais fácil mudar a cultura de pesquisa, incorporando novas tecnologias devido ao desenvolvimento da inteligência artificial”. Ele contou que está realizando experimentos sobre modelos de controle.  

“Lógico que não vai ser uma coisa gigantesca, algo que você só consegue no serviço pago, mas ele estará especializado para um determinado conjunto de dados. Então, (poderemos) rodar modelos de linguagem, com dados abertos”, explica. 

Projetos para o futuro 

Mariano citou algumas novidades que o Laboratório Multiusuários pretende desenvolver a partir deste 2026 em parceria com o INEU. “A primeira coisa que pode ser interessante é o acesso remoto, através de um protocolo com duplo fator de autenticação, de forma a manter uma segurança reforçada do sistema. Isso está pronto”.  

“Vai ter um formulário que a pessoa preenche, seguindo as instruções. O primeiro acesso terá a explicação do protocolo completo, como é que ele funciona. Depois tem as bases de dados, na qual o Laboratório atua sob demanda. É a demanda que vai determinar o que a gente vai fazer”, detalhou. 

Outra possibilidade é que o Laboratório seja um repositório de dados, mas também tenha o seu repositório. “A nossa política é não excluir outros repositórios”, afirmou, ao defender um processo capaz de ajustar políticas de gestão de dados, garantindo “uma base de dados de grande capacidade, na casa dos terabytes”, prometeu.  

O debate sobre a capacidade de armazenamento seria preponderante, por exemplo, para projetos como o de uma biblioteca virtual. “Nós temos condições digitalizar e converter (os livros) tranquilamente”, disse, ao informar que a proposta de fazer uma biblioteca “já está sendo desenvolvida”. 

O sistema também pode auxiliar na gestão dos dados das pesquisas, algo cada vez solicitado pelos pesquisadores. “Muitas vezes, eu vejo projetos de gestão de dados, apenas para constar nos meios burocráticos, quando ela pode até dar mais visibilidade para uma pesquisa. Isso pode ser um apoio também”, acrescentou Mariano. 

Segundo ele, uma das possibilidades para melhorar a gestão de dados seria a automatização de alguns procedimentos. “Nós poderíamos automatizar como a pessoa está gerando esses dados. Ela pode colocar os dados em determinado local e o algoritmo subir em outros repositórios, facilitando o trabalho do pesquisador”, explicou. 

Ele também destacou que, ao longo de 2026, o Laboratório Multiusuários será apresentado para os pesquisadores, que serão orientados sobre como o sistema funciona e qual as melhores formas de aproveitamento da sua estrutura, desenvolvendo técnicas de pesquisa para aperfeiçoar seus trabalhos. 

Conclusão 

Após a participação de Mariano e Almeida, o pesquisador Pedro Henrique Vasques, salientou que o objetivo é tornar o Laboratório mais presente nas atividades dos pesquisadores, atuando como um “potencial parceiro para se recorrer a ele, pensar junto e criar alternativas”. 

Segundo o pesquisador, o Laboratório também será importante para melhorar as práticas de gestão do próprio INEU, por exemplo, marcando a produção dos pesquisadores e, ao mesmo tempo, sistematizando essa produção.  

“É algo que podemos automatizar e poupar bastante tempo, seja na produção de relatórios, seja para entender o que o próprio INEU está fazendo, porque temos uma rede com mais de 100 pesquisadores”, destacou. 

Vasques também citou o exemplo de estudos relacionados à questão jurídica nos Estados Unidos. Poderíamos pensar em “pesquisar, mapear e criar um banco de dados de decisões judiciais nos tribunais dos Estados Unidos, dividindo-o por tema, por tribunal, por cada instância”.  

Ao comentar o projeto, o professor e coordenador do INCT-INEU, Andrei Koerner, destacou que o Laboratório abre a possibilidade de se repensar dinâmicas para aproveitar os recursos de tecnologias digitais mais avançadas.  

“Eu e Marcelo somos de outra geração, que pensa a metodologia, a concepção do objeto, a implementação teórica, mas quando entra na parte da pesquisa empírica, nós temos um treinamento ainda manual. E como ele (Marcelo) falou, nós sequer imaginamos o que ainda pode ser feito para automatizar ou amplificar o escopo dos dados”, destacou Koerner. 

O professor da Unicamp também destacou a necessidade, frente ao uso dessa tecnologia mais avançada, de um treinamento específico para que os pesquisadores possam utilizá-la, explorando suas potencialidades.

 

* Sobre o OPEU, ou para contribuir com artigos, entrar em contato com a editora do OPEU, Tatiana Teixeira, no e-mailprofessoratatianateixeira@outlook.com. Sobre as nossas newsletters, para atendimento à imprensa, ou outros assuntos, entrar em contato com Tatiana Carlotti, no e-mailtcarlotti@gmail.com.

 

Assine nossa Newsletter e receba o conteúdo do OPEU por e-mail.

Siga o OPEU no InstagramTwitter Linkedin e Facebook e acompanhe nossas postagens diárias.

Comente, compartilhe, envie sugestões, faça parte da nossa comunidade.

Somos um observatório de pesquisa sobre os Estados Unidos,

com conteúdo semanal e gratuito, sem fins lucrativos.

 

Realização:
Apoio:

Conheça o projeto OPEU

O OPEU é um portal de notícias e um banco de dados dedicado ao acompanhamento da política doméstica e internacional dos EUA.

Ler mais