Upgrade to Pro — share decks privately, control downloads, hide ads and more …

O futuro da genealogia e o uso de ferramentas IA

Avatar for João Ventura João Ventura
May 09, 2025
49

O futuro da genealogia e o uso de ferramentas IA

A evolução das tecnologias de informação permite-nos investigar a partir de casa, dispensando deslocações aos arquivos. No entanto, quem se inicia no campo é desencorajado pela baixa indexação dos registos, apesar de iniciativas com muito mérito.

Recentes avanços em sistemas como o Transkribus ou o CAI da FamilySearch, apontam para um futuro com indexação automática, apesar de alguns desafios: o Transkribus apesar de ler a informação, não a indexa, e o CAI, apesar da vasta cobertura, restringe o acesso às fontes. Talvez a solução para este problema passe por uma colaboração entre as instituições e o público. A solução mais simples seria desbloquear o CAI. Outra seria a criação de um sistema partilhado de indexação por voluntários e arquivistas, com aprovação destes últimos.

Felizmente existem outras aplicações práticas onde os sistemas como o ChatGPT podem já ser bastante úteis como a elaboração de textos ou a descrição do contexto histórico da vida dos nossos antepassados.

https://www.apgenealogia.pt/coloquio/

Avatar for João Ventura

João Ventura

May 09, 2025
Tweet

More Decks by João Ventura

Transcript

  1. João Ventura Colóquio Nacional de Genealogia - Angra do Heroísmo,

    8-10 Maio 2025 O futuro da genealogia e o uso de ferramentas IA
  2. Biografia breve • Nascido em Faro em Abril de 1974

    • Eng. Informático pela NOVA FCT em 1997, Mestrado na FCUL em 2001 • Pai do Leonardo (n. 2006 em Faro) e do Rafael (n. 2007 em Tres Cantos - Madrid) • Residente em Darmstadt (Alemanha, cerca de 30km a sul de Frankfurt) desde 2012 • Eng. de IVV na Agência Europeia de Satélites Meteorológicos (EUMETSAT)
  3. Genealogia no presente • Cada vez mais “teletrabalho”, com a

    disponibilização de documentos online, a deslocação aos arquivos já não é tão frequente. • Recurso a bases de dados confiáveis como os casos (entre outros): ◦ Nós Portugueses ◦ CITCEM-GHP ◦ Genealogias do Algarve ◦ Geneanet • E menos confiáveis: ◦ Geni ◦ FamilySearch • Para os iniciados, uma actividade de “recorte e colagem”, copiando ramos de árvores existentes em serviços online…
  4. O que é a “IA” • Modelos treinados com vastas

    quantidades de dados • Treino avaliado comparando a saída do modelo com dados “reservados” para avaliação • Re-aprendizagem de acordo com a avaliação até obter os resultados desejados • Tudo isto exige vastas quantidades de computação e de informação
  5. LLM - Large Language Models • Modelos de linguagem de

    grande escala • Treinados em textos existentes de forma a gerar texto indistinguível de um humano • Estima-se que os LLM actuais sejam treinados usando a totalidade da informação existente na Internet • Exemplos: ◦ ChatGPT ◦ Gemini ◦ Claude ◦ DeepSeek
  6. HTR - Handwritten Text Recognition • Modelos treinados para reconhecer

    texto escrito • Conjunto de treino composto por imagens base e correspondente transcrição • Conjunto de avaliação com dados de igual qualidade, não usado para treino • Quanto maior a riqueza dos dados iniciais, melhor a qualidade do modelo • Exemplos: ◦ Transkribus ◦ CAI da FamilySearch
  7. Transkribus (Portuguese Handwriting 16th-19th c.) Aos tres dias do mes

    de junhoo do anno de mill oito centos noventa e quator, nesta Rguja á podial de Nossa Senhoraa do Lue da Villa de Payva Conalho da mesma Villa Deree do Algaera Vasali sei puleunamente, procedendo lianca do Peullentis piam a Reverenolicimo Sonbre Meuhrisco = Bispo a esta Deousa, nm individar do sobo Jereniu a quem dei o nome de Lacilia, e que lsou n esta Juquezia no dia crato do mel de serueiro do anno de sua filha legitima jnimiia de nome/ de Sose Robeieo Ainitimo, natural de Lagos, e Maria delos Iaaieos goverro de casa os Olhao onde fo para ocastillos saarochianos d asa Jnequeria e mon esm neccidentalmente no ditto ou conoha
  8. ChatGPT > Por favor transcreve este texto em Português Claro!

    Aqui está a transcrição do texto em português da imagem: Lucília Assento N.º 31 Aos três dias do mez de junho do anno de mil novecentos e quatro, n’esta Egreja Parochial da Nossa Senhora da Luz da Villa da Lagoa, concelho da mesma Villa, Diocese de Angra, Baptizei solenemente, por excepção licença do Ex.mo e Rev.mo Senhor Bispo d’esta Diocese, uma recemnascida do sexo feminino a quem dei o nome de Lucília, e que nasceu n’esta freguezia no dia sete do mez de janeiro do anno de mil novecentos e quatro, filha legítima e primogênita de João Silvério Clementino, natural da Lagoa, e Maria das Dores, governa de casa, do Outeiro, onde foi born accidentalmente no sítio das Covas...
  9. Desafios • Necessário investimento para treinar modelos (talvez 3) ◦

    Registos 1860-1911 (minuta do DR 19/08/1859) ◦ Registos séc. XVIII - XIX (livres, sem abreviaturas ◦ Registos séc XVI - XVII (dificeis, cheios de abreviaturas) • Uma vez o modelo treinado, execução da indexação • Base de dados com os resultados • Se feito por privados, necessário acesso a imagens de alta resolução sem marcas de água • Custos de todos estes processos • Grátis e disponível agora na FamilySearch, mas só para membros LDS
  10. ChatGPT > Please provide historical context Historical Context of João

    Lourenço Chãozinha’s Life (1799–1854) 1. Early Life (1799–1825): War and Instability French Invasions of Portugal (1807–1811) The Royal Family Flees to Brazil (1807) Liberal Revolution of 1820 2. Adulthood & Marriage (1825–1854): Civil War and Reforms João’s Marriage in 1825 Portuguese Civil War (1828–1834) The Rise of Liberal Portugal (1834–1854) João’s Later Life and Death in 1854 João died in São Tomé, Lisbon, on 18 December 1854. However, the 1850s were marked by outbreaks of cholera and other diseases, which might have contributed to his death.
  11. Genealogia no futuro • Bases de dados resultantes de indexações

    automáticas • Árvore única mundial • Sistemas IA capaz de criar a árvore genealógica a pedido do utilizador • Capacidade de descobrir o parentesco comum mais recente entre cada indivíduo • Capacidade de recriar um esboço da história de cada antepassado, com enquadramento no contexto histórico • Uso de IA para verificação e melhoria de genealogias “artesanais”
  12. CREDITS: This presentation template was created by Slidesgo, and includes

    icons by Flaticon, and infographics & images by Freepik Obrigado! Perguntas? Dúvidas? Sugestões? [email protected] https://tombo.pt Please keep this slide for attribution youtube.com/@tombo_pt facebook.com/tombo.pt instagram.com/tombo.pt