$30 off During Our Annual Pro Sale. View Details »

O ChatGPT e outras IAs vão mudar toda a pesquis...

O ChatGPT e outras IAs vão mudar toda a pesquisa científica

O ensaio procura elucidar as transformações que o Chat GPT e outras inteligências
artificiais tendem a causar na pesquisa acadêmica, como: busca, seleção e leitura de literatura
acadêmica, análise e apresentação de dados; escrita e tradução. Discutimos algumas possíveis
consequências, riscos e paradoxos no uso de IAs para a pesquisa, tais como dilemas de autoria,
potencial deterioração da integridade da pesquisa, limitação das abordagens metodológicas,
possíveis modificações nas dinâmicas de produção de conhecimento e nas relações centro-
periferia no ambiente acadêmico. Concluímos demandando por um diálogo aprofundado sobre
regulação e criação de tecnologias adaptadas às nossas necessidades.

Rafael Sampaio

August 28, 2023
Tweet

More Decks by Rafael Sampaio

Other Decks in Science

Transcript

  1. Como o ChatGPT e as IAs vão mudar toda a

    pesquisa científica Rafael Cardoso Sampaio
  2. O ChatGPT • https://chat.openai.com/ • Baseado na arquitetura Generative Pre-training

    Transformer (GPT) • O GPT-3 apresenta 175 bilhões de parâmetros, um aumento significativo em relação aos 1,5 bilhão de parâmetros do GPT-2, resultando em um aumento substancial na capacidade e capacidades de aprendizado do modelo. • O GPT 4 já apresenta cerca de 1 TRILHÃO de parâmetros.
  3. O ChatGPT • Os modelos de linguagem tentam prever a

    probabilidade de uma sequência de palavras que uma interação humana típica provavelmente criará por meio de algoritmos generativos e discriminativos, geralmente por meio da aplicação de aprendizado profundo e arquiteturas transformadoras de redes neurais • Um dos maiores mistérios é como as informações são • distribuídas, organizadas e utilizadas por meio de • redes neurais profundas e muito grandes
  4. Prompt No contexto do processamento de linguagem natural (NLP) e

    ML, um prompt refere-se a um trecho de texto que é fornecido como entrada para um modelo de linguagem AI para gerar uma resposta ou saída. O prompt pode ser uma pergunta, uma declaração ou uma frase e é usado para fornecer contexto e direção ao modelo de linguagem.
  5. Exemplo de Prompt Você foi selecionado como Editor para um

    trabalho acadêmico de doutorado. Sua função é realizar uma revisão substancial, aumentando a clareza e a consistência do texto. É necessário adotar um estilo acadêmico, com um tom analítico e pressupondo um leitor avançado. O limite para a revisão é de 1000 palavras. Certifique-se de manter a estrutura lógica, rever a gramática e a terminologia corretamente.
  6. Exemplo de Prompt Atuar como: Editor Grau de revisão: Revisão

    substancial Tipo de edição: Aumentar a clareza e a consistência Alterar o estilo para: Acadêmico, trabalho de doutorado Alterar o tom para: Analítico Alterar o nível de compreensão do leitor para: avançado, pressupõe amplo conhecimento prévio Alterar a extensão para: 1000 palavras
  7. Contexto • No campo da GPT, o contexto refere-se às

    palavras e frases que vêm antes do prompt do usuário. • Esse contexto é usado pelo modelo de linguagem para gerar a próxima palavra ou frase mais provável, com base nos padrões e relacionamentos encontrados nos dados de treinamento.
  8. Dados de treinamento (GPT-3) Wikipedia 3% Artigos científicos Google Books

    Github (?) Twitter (?) Common Crawl (coletados ao longo de um período de 8 anos) - 60% WebText2 (páginas da web vinculadas em postagens do Reddit) 22% Books1 e Books2 (livros disponíveis na internet) 16%
  9. 1. Busca e seleção de artigos • Paradigma atual da

    pesquisa científica está está em plena alteração diante de nós. • Busca e seleção de artigos: Conjunto de IAs de IAs para busca de tópicos, pesquisas e pesquisas e artigos acadêmicos. • Aplicativos digitais comoScispace, Elicit, Elicit, Inciteful, Research Rabbit permitem permitem pesquisa semânticamas retornando mais que referências, mas mas respostase trechos.
  10. • Mostram conexões desses artigos com com a literatura e

    trabalhos similares similares . . • Alg umas IAs já g eram mapas de referências, como Inciteful, Litmaps, Research Rabbit. • Possibilidade de criar biblioteca pessoal dentro do aplicativo para aprimorar buscas e sug estões.
  11. • Alguns aplicativos, como como o scite_, tentam tentam mostrar

    o impacto de pesquisas pesquisas , avaliando a , a valência das pesquisas pesquisas e mostrando mostrando trechos refutados ou apoiados apoiados pela literatura literatura acadêmica. • Todos esses aplicativos de IA podem acelerar as revisões de literatura, indicando de maneira mais rápida os artigos mais promissores a serem lidos.
  12. 2. Leitura dos artigos • IA também irá mudar a

    leitura do material acadêmico (e outros). • Programas como Scholarcy, Resoomer, Elicit, Paper Digest, Scispace, Humata, Explain Paper, Paper Brain, Chatpdf e Myreader resumem ou "conversam" com o arquivo. • Usuário pode perguntar à IA sobre aquele upload, perguntando quantidade de casos analisados, metodologia, principais conclusões e conceitos chave. • Teremos resumos automáticos de artigos acadêmicos e visualização de vários artigos simultaneamente.
  13. • Anotar trechos e categorizar em em AIs como Lateral.ai

    sugere sugere novos trechos do que foi que foi definido naquela categoria. • Ferramentas IA maximizam a extração de cada artigo publicado. • IAs tendem a substituir gerenciadores padrões de referência.
  14. 3. Análise de dados e programação Desde seu lançamento, o

    Chat GPT provou-se um grande auxiliar na elaboração e correção de códigos de programação de todas as naturezas. E o code interpreter do ChatGPT é um game changer (quase um cientista de dados a seu dispor) Github copiloté outro exemplo aplicado e funcional. Wolpfram é um específico para cálculos matemáticos.
  15. 4. Escrita dos materiais • Plataformas como ResearchRabbit, Writefull, Word

    Tune e Quillbot fazem correções gramaticais, ortográficas e estruturais nos textos. • Avaliam linguagem, estrutura, dados, tabelas e referências dos manuscritos. • Co-pilotos: IA que "lê" e faz sugestões ao texto, alimentada por outros textos inseridos e estilo de escrita. • Tais ferramentas afetarão significativamente nosso modo de escrever e autoria/ separação das IAs será cada vez mais difícil.
  16. 5. Apresentação dos dados • ChatGPT 4 já é capaz

    de gerartabelas, gráficose outrasrepresentaçõesvisuais • Gamma, Tome criam apresentações inteiras sobre algum assunto, usando ChatGPT para textos e Dall-e para imagens. • Canva também já apresenta AI para textos e apresentações. • Ferramentas comoMidjourneypossibilitamque jornalistase autoresilustremsuasmatérias.
  17. 6. Tradução 1 Multi-idiomas Capacidade de de interagir em em

    muitos idiomas, com boa performance nas línguas mais faladas do do mundo. 2 LLMs Entregaexpressões mais fidedignas e mais similares às nativas na língua acadêmica. 3 Materiais acadêmicos Mais próximas do tom e estruturada pesquisa, ideal para pesquisadores interessados em traduzir seus idiomas nativos para o inglês ou corrigir eventuais escritos nesse idioma.
  18. I. Autoria, plágioe fontes • Novas formas de autorias e

    perda de controle do pesquisador sobre o processo de pesquisa levantam questões éticas. • Um texto que é escrito por um humano e apenas revisado pela inteligência artificial deixa de ser humano? • Se um humano cria uma boa parte de um texto, entretanto pede à IA para complementar, cruza limite ético? • Se a IA ler um texto de nossa autoria e elaborar o resumo ou o título, ele será um texto da máquina?
  19. - Poucos consensos existem sobre essas questões, exceto que IAs

    não podem ser consideradas autoras de trabalhos acadêmicos devido à ausência de accountability; - Caso ferramentas de IA sejam utilizadas, devem ser mencionadas em uma seção dedicada do artigo acadêmico, especificando seu uso, com foco na transparência (por exemplo, tornando públicos os prompts e diálogos). - As preocupações com plágio vão além da escrita e provas online. IAs podem facilmente gerar imagens, gráficos, tabelas e mesmo apresentações inteiras (isso para não mencionar áudios e vídeos!!)
  20. - A discussão deve se concentrar na autoria, direitos autorais,

    fontes e nos limites da cooperação entre seres humanos e máquinas, em vez de se limitar apenas à trapaça. - O extenso treinamento dessas ferramentas (em bilhões ou até trilhões de parâmetros) acrescenta complexidade à regulamentação, uma vez que são áreas opacas. - Várias ferramentas de detecção de uso de IA em texto existiam durante a composição, porém nenhuma foi considerada infalível. - É crucial enfatizar que Bard, Chat GPT, Claude, Llama e modelos similares NÃO CONSEGUEM detectar plágio ou uso de IA.
  21. Por que a máquina recomendou a leitura de determinado texto

    em detrimento de outro? Por que ela recomendou fazer um teste estatístico ou uma representação visual específica? Chat GPT e similares podem gerar respostas aparentemente plausíveis, mas análises detalhadas frequentemente revelam desconexões, imprecisões e distorções.
  22. Isso afeta a confiança nos resultados das IAs, limitando a

    avaliação de sua validade e prejudicando a replicação em pesquisas. Questões relacionadas ao uso da IA transcendem (e aumentam!) a crise de transparência e reprodutibilidade acadêmica.
  23. III. Restrição do leque de possibilidades para a pesquisa •Mudanças

    nos padrões de busca e recomendação: • Paradigma anterior: links em pesquisas, relevância baseada em critérios. • Paradigma atual: chatbots fornecendo respostas diretas e rápidas. • Impacto na profundidade das discussões e debates. • Primeira resposta de IA vista como "verdade" sem considerar dissensos. • Aumento de reprodução de desigualdades na produção de conhecimento científico. • Aumento do impacto nas citações a autores reconhecidos e dificuldades para novos pesquisadores, para grupos subrepresentados e mesmo inovação.
  24. - Automação e terceirização de escolhas pelas IAs podem reduzir

    opções e conhecimento de futuros pesquisadores em termos de familiaridade com autores, fontes, literatura acadêmica, métodos de pesquisa e programação. - Não que isso seja necessariamente novo ou disruptivo. Vimos situações similares com tecnologias que impactaram profundamente a ciência, como a calculadora científica, o computador pessoal, a World Wide Web, o Google, a Wikipedia e softwares acadêmicos.
  25. Outro paradoxo é o fato das IAs só reproduzirem conhecimentos

    já disponíveis. Elas não geram textos originais em um sentido forte, mas reproduzem tudo que já foi produzido pela humanidade, apenas ordenando para estatisticamente fazer sentido. - Paradoxalmente, futuros pesquisadores poderão “ler” dezenas de artigos simultaneamente; elaborar “revisões de literatura automatizadas”; raspar, limpar e analisar quantidades massivas de dados;
  26. Boa parte das ferramentas é paga ou cobra por opções

    avançadas. Discussão sobre uso dos recursos das universidades. Dependência de tecnologias desenvolvidas por países que concentram a pesquisa acadêmica e aumentando o nosso papel como país colonizado em termos de apenas exportarmos dados e importamos tecnologia. Grandes centros de pesquisa fazendo uso de tais IAs vão abrir ainda mais vantagem na comparação com o resto do mundo.
  27. • Paradoxo da Internacionalização da Pesquisa: • Dependência das tecnologias

    centralizadas, mas crescimento exponencial de aplicativos dedicados à tradução e correção. • Diminuição da barreira linguística como obstáculo para publicação em revistas de alto impacto. • Utilização de aplicativos como Deepl, que oferecem traduções superiores ao Google Translate junto ferramentas de correção em inglês, como Grammarly, Quillbot, Writefull. • Uso de LLMs para aprimorar traduções, aproximando-as do jargão acadêmico. • Não se defende o fim da tradução por humanos, mas será mais fácil para pesquisadores traduzirem ou escreverem diretamente em outras línguas.
  28. o fim da pesquisa científica como conhecemos ou apenas lágrimas

    na chuva? • O uso de IAs na pesquisa acadêmica traz benefícios, todavia apresenta desafios éticos, sociais e politicos • É importante discutir e refletir sobre essas implicações. Buscar maneirasde maximizaros benefícios e minimizaros riscos das IAs na pesquisa • Desigualdade no acesso a essas tecnologias(norte x sul global) é uma preocupação, é importante garantir que essas tecnologiassejam acessíveis a todos.
  29. A proibição dessas ferramentas não colocará o Brasil em posição

    de liderança nem em regulação e nem em desenvolvimento de tecnologias baseadas em IA, o objetivo precisa ser buscar protagonismo. É preciso regulamentar questões como autoria, direitos autorais e fontes. Maritaca.ai por exemplo é um LLM ajustado para o português e especificidades do país (empresarial). Possibilidade de desenvolver modelos, chatbots, aplicativos e outras IAs voltadas para necessidades acadêmicas, considerando as especificidades nacionais.
  30. • Iniciativa "Inteligência Artificial Aplicada às Políticas Públicas" deseja criar

    um chatbot para políticas públicas (ChatPP). • Uso de IA para facilitar a participação cidadã em decisões, e qualificar gestores e agentes da sociedade civil organizada. • Não devemos aceitar a imposição de Nature e Science sobre o que deve ou não ser feito com IAs. • Elaborar nossos próprios paradigmas do sul-global
  31. O ChatGPT e as inteligências artificiais tendem a terceirizar as

    principais escolhas acadêmicas CINCO MUDANÇAS DA INTELIGÊNCIA ARTIFICIAL NA PESQUISA CIENTÍFICA SAMPAIO, R.; NICOLÁS, A.; JUNGUILHO, T.; SILVA, L.; FREITAS, C.; TELLES, M.; SENNA, J. ChatGPT e outras IAs transformarão toda a pesquisa científica: reflexões iniciais sobre usos e consequências. SciELO Pré-prints, 2023. @fotoartificialbr Ciberreferências:
  32. Bônus ferramentas de busca Connected Papers https://www.connectedpapers.com/ Consensus https://consensus.app/ Elicit

    https://elicit.org/ Perplexity https://www.perplexity.ai/ Litmaps https://app.litmaps.com/ Inciteful https://inciteful.xyz/ Research Rabbit https://www.researchrabbit.ai/ OAMG https://oa.mg/ Scite https://scite.ai/ Scispace https://typeset.io/ Scinapse https://www.scinapse.io/
  33. Bônusespecial • Ferramentas de leitura • ChatPDF https://www.chatpdf.com/ • Humata

    https://app.humata.ai/ • Myreader https://www.myreader.ai/ • Resoomer https://resoomer.com/ • Scholarcy https://www.scholarcy.com • Scispace • https://typeset.io/
  34. Bônussecreto • Análise • Ask CSV • https://askcsv.com/ • Data

    Squirrel • https://datasquirrel.ai/ • Intellectus Statistics • https://www.intellectusstatistics.com/. • Panda Chat • https://pandachat.ai/ • Rows Rows.com • Wolfram Alpha https://www.wolframalpha.com/
  35. Bônusplus a mais • Escrita Acadêmica • Cowriter https://cowriter.org/ •

    Forefront https://chat.forefront.ai/ • Jenni https://app.jenni.ai/ • Language Tool https://languagetool.org/ • Lateral https://www.lateral.io/ • Napkin https://www.napkin.one/ • Notion AI https://www.notion.so/ • Paperpal https://edit.paperpal.com/ • Paraphrase Tool https://paraphrasetool.com/ • Quillbot https://quillbot.com/ • Rytr https://app.rytr.me/ • Scispace https://typeset.io/ • Trinka https://www.trinka.ai/ • Wordtune https://app.wordtune.com/ • Writefull https://writefull.com
  36. Bônus do bônus Agregadores de IAs (não apenas acadêmicas) AI

    Library https://library.phygital.plus/ Aitoolkit https://www.aitoolkit.org/ Futurepedia https://www.futurepedia.io/ Product Hunt https://www.producthunt.com/ SaaS AI Tools https://saasaitools.com/ There's an AI for that https://theresanaiforthat.com/ TopAI https://topai.tools/ Repositório de prompts Snack Prompt https://snackprompt.com/ GPT Prompt Tuner https://gptprompttuner.com/ Prompt Perfect https://promptperfect.jina.ai/ Flow GPT https://flowgpt.com/