Quando li por primeira vez a famosa frase “O que não se mede não se gerencia“ atribuída a Peter Drucker e que traduz a essência que os KPIs devem ter, em seguida veio a minha mente uma outra do químico russo, criador da Tabela Periódica dos elementos químicos, Dmitri Mendeleiev “A ciência começa onde começa a medição…“
Esta frase me acompanhou durante vários anos quando estudava engenharia, ela estava pendurada na porta do laboratório de sensores da Universidade Técnica de San Petersburgo, onde Mendeleiev foi fundador de uma das cátedras e de certa maneira guiou minha vida profissional.
A Tabela Periódica de Mendeleiev é fascinante pela sua simplicidade, ela aparece tanto em livros escolares como em teses de doutorado, possui um desenho moderno (user friendly e até diria touch!) e combina capacidades ímpares de explicação, representação e previsão. Mais que uma solução a um problema da química, é um exercício supremo de raciocínio do machine learning e data visualization, e também daquilo que hoje resumimos como Data Science.
Em 1869, enquanto trabalhava em seu livro Princípios de Química, Mendeleiev escreveu os nomes dos elementos e algumas das suas principais propriedades em fichas individuais, para poder assim facilitar a classificação. Enquanto ordenava as fichas, ele descobriu a existência de um padrão que nós conhecemos agora como a tabela periódica. Mendeleiev ordenou as fichas segundo os pesos atômicos dos elementos que formavam óxidos similares. Ao classificar por linhas e por colunas, ele estabeleceu a estrutura da tabela periódica usado desde então.
A Tabela Periódica de Mendeleiev é um exercício supremo do raciocínio do Data Science
A genialidade de Mendeleiev reside no fato de que ele percebeu que os elementos tem uma ordem fundamental: ele não projetou a tabela periódica, ele a descobriu! Ele não só foi capaz de prever a existência de (então) novos elementos representados por “buracos” na tabela, mas também forneceu estimativas precisas de suas propriedades químicas e físicas. Em alguns casos, Mendeleiev também alterou a ordem dos pesos atômicos, de modo que os elementos semelhantes aparecessem no mesmo grupo. Esta aparente anomalia foi explicada posteriormente na teoria de isótopos.
Na figura acima, versão da tabela periódica de Mendeleiev, na primeira edição do seu livro de texto.
A classificação dos elementos químicos é um problema clássico de classificação guiado pelos dados. Apesar de existir hoje diversos algoritmos que poderiam chegar a resultados semelhantes, continua sendo uma solução não trivial. Vejam nas seguintes referencias intentos interessantes que abordam esta questão.
- Periodic Table of the Elements in the Perspective of Artificial Neural Networks (Lemes and Dal Pino, 2011)
- From Periodic Properties to a Periodic Table Arrangement (Besalú, 2013)
Mendeleiev resolveu esta questão sem possuir os recursos computacionais atuais e com o agravante de estar diante de um problema com censura, já que muitos componentes ainda não tinham sido descobertos e portanto, tinham que ter seus espaços previstos e “guardados” na tabela.
Recentemente a Tabela ganhou quatro novos elementos químicos, completando sua sétima linha – os livros de química acabaram ficando desatualizados, mas não a genialidade da Tabela, que continua sendo a referência da classificação dos componentes químicos que nos rodeiam – tanto para cientistas como para milhões de pessoas comuns … e para nós, os cientistas de dados, um exemplo da mescla perfeita Data + Science!
(Publicado no Linkedin)