O primeiro passo para contribuir para o projeto é achar informação que integre com o tema e que ainda não esteja presente na Wikidata, aspectos como programas de pós-graduação, pesquisadores e suas afiliações são todos bem vindos!
Você pode tentar adicionar essa manualmente usando a ótima interface web da Wikidata, para esse fim temos um tutorial que pode ser útil.
No entanto, caso deseje adicionar dados em larga escala, você pode seguir de diferentes maneiras. Atualmente, o método preferido pelo projeto tem sido utilizar uma combinação de Notebooks Jupyter para extrair e manipular os dados para um formato adequado para a Wikidata e Google Sheets para reconciliar a informação a itens já existentes na Wikidata. No momento, possuímos dois Jupyter Notebooks na pasta 'tutorial' deste repositório explicando o processo que pode ser usado como modelo, contudo, o passo-a-passo pode ser descrito como:
-
Caso a informação esteja num website - como a página de um programa - raspamos a informação usando um dos pacotes de raspagem de dados do Python, beautifulsoup4.
-
Com os dados extraídos para uma planilha (como um .csv), inserimos os dados no Google Sheets, utilizando o add-on Wikipedia e Wikidata Tools para reconciliar a informação a itens da Wikidata.
-
Por fim, criamos um novo Notebook Jupyter onde formataremos os dados reconciliados para um formato aceito pelo Quickstatements, uma ferramenta que permitirá a adição de informação em lotes para a Wikidata.
Tendo uma contribuição que siga a temática do projeto, sinta-se livre para criar um fork do repositório e enviar suas contribuições como um pull request