Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Provenance in Species Distribution Modeling

matiskay
December 01, 2017

Provenance in Species Distribution Modeling

matiskay

December 01, 2017
Tweet

More Decks by matiskay

Other Decks in Programming

Transcript

  1. Edgar Sarmiento Tainara Soares Mestrado em Modelagem Computacional Introdução a

    Workflows Científicos e suas Aplicações Professores: Luiz Gadelha e Kary Ocaña
  2. Definição: A modelagem preditiva de distribuição de espécies consiste em

    um processamento computacional que combina dados de ocorrência de uma ou mais espécies com variáveis ambientais, construindo assim uma representação das condições requeridas pelas espécies (Anderson et al. 2003)
  3. Existem três fatores principais que determinam a distribuição geográfica: 1)

    condições abióticas (por exemplo, o clima); 2) fatores bióticos (por exemplo, interações entre espécies); 3) capacidade de dispersão, através de sua locomoção ou através de agentes externos, o que determina o grau de acessibilidade da espécie a outras áreas. Sendo que as condições abióticas e os fatoresbióticos são uma função direta do nicho. Figura 1 ‒ A: área onde as condições abióticas são favoráveis para a espécie. B: região onde as condições bióticas são favoráveis; M: área que a espécie foi capaz de alcançar em um dado período;
  4. • O cruzamento de fatores bióticos e abióticos mais as

    informações de capacidade de dispersão disponíveis são utilizados para a modelagem da distribuição de espécies. • São utilizados algoritmos que captam os dados de fatores abióticos e bióticos, além de fatores de capacidade de dispersão, quando disponíveis. • Os algoritmos processam estes dados e removem possíveis erros. • Em seguida estas informações são cruzadas e são gerados gráficos com as possíveis distribuições destas espécies pelo território definido.
  5. • workflows e gerenciadores de workflows científicos vão: ◦ agilizar

    a execução destes algoritmos ◦ melhorar o desempenho da modelagem ◦ orquestrar e otimizar todo o processamento ◦ gerando melhores resultados. ➔ Utilizamos para este trabalho um aplicativo de modelagem de distribuição de espécies que já organizado por meio de um workflow, e que foi implementado na linguagem R. ➔ Pretendeu-se obter dados de proveniência gerados por este workflow e representá-los por meio de um grafo para sua melhor visualização e análise.
  6. ➢ Gerar um grafo de proveniência para uma aplicação de

    modelos de distribuição de espécies.
  7. Rupicola peruviana (galo-da-serra-andino) • É uma espécie de ave encontrada

    somente na área montanhosa do norte da América do Sul, habitando os Andes, desde o sul da Venezuela até a Bolívia. • Se alimenta principalmente de frutas e contrói seus ninhos nas faces rochosas de penhascos, grandes rochas, grutas ou em profundos desfiladeiros. • Os hábitos de acasalamento e de formação de ninhos do galo-da-serra andino aumenta a diversidade e densidade de plantas do local. Ao comer frutas ele engole muitas sementes inteiras, as quais a maioria não são danificadas ao passar pelo seu sistema digestivo. Desta forma, ao regugitá-las ou defecá-las muitas destas sementes continuam com poder germinativo e são dispersas a distâncias consideráveis das árvores mães.
  8. Ara ararauna (Arara-canindé) • É uma espécie de ave encontrada

    hoje desde a Amazônia até o Paraná. No passado podia ser encontrada até Santa Catarina. Também é encontrada no leste do Panamá até o norte da Argentina. • Migra em certas épocas do ano para buscar alimento. • Sua dieta é baseada em sementes, frutas e nozes. • Também possui papel de dispersor de sementes, sendo importante para aumento da quantidade de vegetação e diversidade da mesma. • Nidifica em ambientes altos e dispersa sementes pela floresta.
  9. Proveniência ➔ A proveniência é a informação acerca das entidades,

    atividades e personagens envolvidas na produção de dados ou coisas, que pode ser usada para assegurar sua qualidade e veracidade. ➔ PROV-DM é um modelo de dados conceitual que é usado pela W3C.
  10. Entidade ➢ É uma coisa física, digital, conceitual ou outro

    tipo de coisa com aspectos físicos. As entidades podem ser reais ou imaginárias. Atividade ➢ Algo que ocorre em um período de tempo e atua sobre as entidades. Uma atividade inclui consumir, processar, transformar, modificar, relocar, usar ou gerar entidades. Agente ➢ Alguém que têm uma forma de responsabilidade sobre uma atividade que se está executando, pela existência de uma entidade ou por outra atividade do agente.
  11. Figura 3 - PROV-O. Uma entidade está representada por una

    elipse amarela, uma atividade é representada por um retângulo azul e um agente por un pentágono laranja.
  12. • Permite usar vários modelos em uma interface de simples

    utilização • Workflow simples 1. Primeramente se obtém os dados de presença e os dados meteorológicos. 2. De forma paralela estes dados são processados e usados para a geração do modelo. 3. Este modelo é projetado sobre um mapa no qual é o resultado final do aplicativo. Figura 4 - Workflow do aplicativo.
  13. ➔ O aplicativo é composto por 5 etapas, as quais

    implementan o workflow descrito na figura 4. 1) Coleta dos dados Para este exemplo os dados são obtidos de uma fonte de dados externa chamada Gbif. Figura 5 - Dados da espécie Rupicola peruviana.
  14. Procedimento: 1. Gerar um log chamado prov.log; Figura 11 -

    prov.log log gerado pela aplicação. 2. Este log foi parseado para gerar o gráfico de proveniência usando a biblioteca Python-Prov, https://github.com/trungdong/prov. Figura 12 - Diagrama de Proveniência para a espécie Rupicola peruviana.
  15. Figura 15 - Gráfico de proveniência para os modelos para

    a espécie Rupicola peruviana. Figura 14 - Gráfico de proveniência para os dados abióticos para a espécie Rupicola peruviana.
  16. Figura 18 - Gráfico de proveniência para os dados abióticos

    para a espécie Ara ararauna. Figura 19 - Gráfico de proveniência para os modelos para a espécie Ara ararauna.
  17. • Extrair proveniência a partir dos logs é uma forma

    fácil e simples de agregar proveniência em uma aplicação. • Python-Prov facilita a geração do gráfico de proveniência.
  18. Anderson, R.P.; Lew, D. & Peterson, A.T. 2003. Evaluating predictive

    models of species’ distributions: criteria for selecting optimal models. Ecological Modelling 162: 211-232. Haemig PD (2011) Ecologia do Galo-da-Serra. ECOLOGIA.INFO 1. Disponível em: http://www.ecologia. info/galo-da-serra-2.htm Acessado em: 05/09/2015 Haemig PD 2012 Ecologia dos Micos-leões. ECOLOGIA.INFO 34. Disponível em: http://www.ecologia.info/micos. htm Acessado em: 05/09/2015 Mahecha, José Vicente Rodríguez; Suárez, Franklin Rojas; Arzuza, Diana Esther; Hernández, Andrés Gonzáles. Loros, Pericos & Guacamayas Neotropicales. Panamericana Formas e Impresos S.A., Bogota D.C., 2005, Pág. 52. http://www.micoleao.org.br/ Acessado em: 05/09/2015 Snow D (1982) The Cotingas. Oxford University Press, UK Soberón, J. 2010. Niche and area of distribution modeling: a population ecology perspective. Ecography 33: 159- 167. http://www.wikiaves.com.br/arara-caninde Acessado em: 05/09/2015