Análise da evolução de redes de colaboração científica para a predição de novas coautorias

Autores

Palavras-chave:

Redes de coautoria, Plataforma Lattes, Repositórios de dados científicos.

Resumo

Doi: https://doi.org/10.1590/2318-0889202234e200033

Ao publicar um artigo em conjunto com outros autores, inicialmente deve-se formar vínculos pela colaboração entre eles, o que
pode ser caracterizado como uma rede de colaboração científica. Nesse contexto, os trabalhos representam as arestas e os autores
representam os nós, formando uma rede. Nesse momento surge a seguinte dúvida: Como a evolução da rede ocorre ao longo do
tempo? Para responder a essa pergunta, é necessário entender quais fatores são essenciais para a criação de uma nova conexão. O objetivo deste artigo é prever conexões em redes de coautoria formadas por doutores com currículos registrados na Plataforma Lattes nas áreas de Ciências da Informação e Biologia. Para tanto, as seguintes etapas são executadas: inicialmente os dados são extraídos e organizados. Essa etapa é fundamental para a continuidade do processo. Em seguida, as redes de coautoria são geradas tomando
como base artigos publicados em conjunto. Posteriormente, os atributos a serem utilizados são definidos e as métricas são calculadas.
Por fim, algoritmos de aprendizado de máquinas são utilizados para estimar futuras colaborações científicas nas áreas selecionadas.
Atualmente, a Plataforma Lattes possui 6,6 milhões de currículos de pesquisadores e representa um dos repositórios científicos mais
relevantes e reconhecidos em todo o mundo. Como resultado, os algoritmos “florestas aleatórias” e “regressão logística” apresentaram
as maiores taxas de acerto, e o atributo “atração preferencial” foi identificado como mais influente no surgimento de novas colaborações científicas. Através dos resultados, é possível estabelecer a evolução da rede de colaborações científicas de pesquisadores em nível nacional, auxiliando as agências de desenvolvimento na seleção de futuros pesquisadores destacados.

Downloads

Não há dados estatísticos.

Referências

Acar, E. et al. Link prediction on evolving data using matrix and tensor factorizations. In: IEEE International Conference on Data Mining Workshops, 2009, Miami. Proceedings online […].Miami: IEEE Computer Society, 2009. p. 262-269. Doi: https://doi.org/10.1109/ICDMW.2009.5.

Adamic, L. A.; Adar, E. Friends and neighbors on the web. Social Networks, v. 25, n. 3, p. 211-230, 2003. Doi: https://doi.org/10.1016/S0378-8733(03)00009-1.

Ahmad, I. et al. Missing link prediction using common neighbor and centrality based parameterized algorithm. Scientific Reports, v. 10, n. 364, p. 1-10, 2020. Doi: https://doi.org/10.1038/s41598-019-57304-y.

Al Hassan, M.; Zaki, M. J. A survey of link prediction in social networks. In: Aggarwal C. (ed.). Social network data analytics. Boston: Springer, 2011. p. 243-275. Doi: https://doi.org/10.1007/978-1-4419-8462-3_9.

Barabási, A.; Albert, R. Emergence of scaling in random networks. Science, v. 286, n. 5439, p. 509-512, 1999. Doi: https://doi.org/10.1126/science.286.5439.509.

Buitinck, L. et al. API design for machine learning software: experiences from the scikit-learn project. ArXiv preprint arXiv:1309.0238, 2013. Available at: https://arxiv.org/pdf/1309.0238.pdf?source=post_elevate_sequence_page. Cited: May 10, 2020.

Dias, T. M. R. et al. Modelagem e caracterização de redes científicas: um estudo sobre a Plataforma Lattes. In: Brazilian Workshop on Social Network Analysis and Mining (BRASNAM), 2., 2013, Porto Alegre. Anais eletrônicos […]. Porto Alegre: Sociedade Brasileira de Computação, 2013. p. 116-121.

Available at: https://sol.sbc.org.br/index.php/brasnam/article/view/6851. Cited: May 10, 2020.

Dias, T. M. R. Um estudo da produção científica brasileira a partir de dados da Plataforma Lattes. 2016. 181 f. Tese (Doutorado em Modelagem Matemática e Computacional) – Centro Federal de Educação Tecnológica de Minas Gerais, Belo Horizonte, 2016.

Dias, T. M. R.; Moita, G. F. Um método para identificação de colaborações em grandes bases de dados científicos. Em Questão, v. 21, n. 2, p. 140-161, 2015. Doi: https://doi.org/10.19132/1808-5245212.140-161.

Digiampietri, L. et al. Um sistema de predição de relacionamentos em redes sociais. In: Simpósio Brasileiro de Sistemas de Informação (SBSI), 11., 2015, Goiânia. Anais eletrônicos […]. Goiânia: Sociedade Brasileira de Computação, 2015. p. 139-146. Doi: https://doi.org/10.5753/sbsi.2015.5810.

Hoffman, M.; Steinley, D.; Brusco, M. J. A note on using the adjusted Rand index for link prediction in networks. Social Networks, v. 42, p. 72-79, 2015. Doi: https://doi.org/10.1016/j.socnet.2015.03.002.

Kerrache, S.; Alharbi, R.; Benhidour, H. A Scalable Similaritypopularity Link prediction Method. Scientific Reports, v. 10, n. 1, p. 1-14, 2020. Doi: https://doi.org/10.1038/s41598-020-62636-1.

Krebs, V. E. Mapping networks of terrorist cells. Connections, v. 24, n. 3, p. 43-52, 2002. Available at: http://ecsocman.hse. ru/data/517/132/1231/mappingterroristnetworks.pdf. Cited: May 10, 2020.

Lane, J. Let’s make science metrics more scientific. Nature, v. 464, p. 488-489, 2010. Doi: https://doi.org/10.1038/464488a.

Liben-Nowell, D.; Kleinberg, J. The link-prediction problem for social networks. Journal of the American Society for Information Science and Technology, v. 58, n. 7, p. 1019-1031, 2007. Doi: https://doi.org/10.1002/asi.20591.

Maruyama, W. T.; Digiampietri, L. A. Co-authorship prediction in academic social network. In: V Brazilian Workshop on Social Network Analysis and Mining (BRASNAM), 2019, Porto Alegre. Anais eletrônicos […]. Porto Alegre: Sociedade Brasileira de Computação, 2019. p. 61-72. Doi: https://doi.org/10.5753/brasnam.2016.6445.

Mena-Chalco, J. P.; Cesar Junior, R. M. Scriptlattes: an opensource knowledge extraction system from the lattes platform. Journal of the Brazilian Computer Society, v. 15, n. 4, p. 31-39, 2009. Doi: https://doi.org/10.1007/BF03194511.

Menon, A. K.; Elkan, C. Link prediction via matrix factorization. In: Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Berlin: Springer, 2011. p. 437-452. Doi: https://doi.org/10.1007/978-3-642-23783-6_28.

Newman, M. E. J. Coauthorship networks and patterns of scientific collaboration. Proceedings of the National Academy of Sciences, v. 101, n. 1, p. 5200-5205, 2004. Doi: https://doi.org/10.1073/pnas.0307545100.

Newman, M. E. J. Mixing patterns in networks. Physical Review E, v. 67, n. 2, p. 026126, 2003. Doi: https://doi.org/10.1103/PhysRevE.67.026126.

Newman, M. E. J. Networks: an introduction. Oxford: Oxford University Press, 2010. Available at: https://dl.acm.org/doi/book/10.5555/1809753. Accessed on: May 10, 2020.

Newman, M. E. J. The structure of scientific collaboration networks. Proceedings of the National Academy of Sciences, v. 98, n. 2, p. 404-409, 2001. Doi: https://doi.org/10.1073/pnas.98.2.404.

Newman, M. E. J; Park, J. Why social networks are different from other types of networks. Physical Review E, v. 68, n. 3, p. 036122, 2003. Doi: https://doi.org/10.1103/PhysRevE.68.036122.

Perez-Cervantes, E. Análise de redes de colaboração científica: uma abordagem baseada em grafos relacionais com atributos. 2015. Dissertação (Mestrado em Ciência da Computação) –Universidade de São Paulo, São Paulo, 2015. Doi: https://doi.org/10.11606/D.45.2016.tde-18122015-114014.

Perez-Cervantes, E. et al. Using Link Prediction to Estimate the Collaborative Influence of Researchers, 2013. In: IEEE 9th International Conference on e-Science, 2013, Beijing. Proceedings online […]. Beijing: IEEE Computer Society, 2013. p. 293-300. Doi: https://doi.org/10.1109/eScience.2013.32.

Potgieter, A. et al. Temporality in link prediction: understanding social complexity. Emergence: Complexity & Organization (E: CO), v. 11, n. 1, p. 69-83, 2009. Available at: https://aisel.aisnet.org/sprouts_all/195. Cited: May 10, 2020.

Ren, T. et al. Identifying vital nodes based on reverse greedy method. Scientific Reports, v. 10, n. 1, p. 1-8, 2020. Doi: https://doi.org/10.1038/s41598-020-61722-8.

Rolf, H. Identifying the collaboration styles of research students. Proceedings of the Association for Information Science and Technology, v. 56, n. 1, p. 750-751, 2019. Doi: https://doi.org/10.1002/pra2.160.

Shakibian, H.; Charkari, N. M. Mutual information model for link prediction in heterogeneous complex networks. Scientific Reports, v. 7, e44981, 2017. Doi: https://doi.org/10.1038/srep44981.

Zhang, P. et al. The reconstruction of complex networks with community structure. Scientific Reports, v. 5, n. 1, p. 1-11, 2015. Doi: https://doi.org/10.1038/srep17287.

Downloads

Publicado

25-07-2022

Como Citar

Affonso, F., Santiago, M. de O., & Rodrigues Dias, T. M. (2022). Análise da evolução de redes de colaboração científica para a predição de novas coautorias. Transinformação, 34, 1–15. Recuperado de https://periodicos.puc-campinas.edu.br/transinfo/article/view/6473

Edição

Seção

Data and Information in Online Environments