CDIA.Rio - Rede de Ciência de Dados & Inteligência Artificial do Rio de Janeiro

Tendências em Ciência de Dados e IA para 2019

Neste primeiro informativo de 2019 estamos trazendo uma análise das principais tendencias em Ciência de Dados (CD) e Inteligência Artificial (IA) para os próximos anos, mas antes de apresentá-las vamos falar de outras tendencias tecnológicas, de forma mais abrangente, até porque todas estas tecnologias acabam se interligando e a maioria vem incorporando, de forma acelerada, CD e IA em suas ofertas.

Na virada de ano sempre aparecem artigos trazendo previsões para o futuro, e não foi difícil encontrar alguns tratando de tecnologias, a começar por um produzido por uma das empresas participantes da CDIA.Rio, a Twist, intitulado “Tendências tecnológicas para o ano de 2019” [1]. Como este, encontramos também [2], [3], [4] e [5], não tendo sido uma surpresa descobrir diversas previsões em comum: 5G, IoT, Segurança, Proteção de dados, Edge Computing, Blockchain, Realidade Virtual (VR), Realidade Aumentada (AR) e Computação Quântica.

É claro que CD e IA foram também mencionados, mesmo nas referências mais “genéricas”, embora de forma mais superficial para não correr o risco de entrar em muitos detalhes e de não ser compreendido pelos leitores. Outro desafio para quem faz previsões é conseguir acertar o que de fato acontecerá na vida real, sendo que a velocidade da evolução tecnológica e sua disseminação por diferentes setores da economia tem tornado isto cada vez mais complicado.

Me parece que algumas publicações tem preferido não falar de tendencias tecnológicas antes dos grandes eventos do inicio de ano, como o Consumer Eletronic Show – CES, em janeiro, e o Mobile World Congress – MWC, em fevereiro, que já se consolidaram como vitrines para grandes lançamentos. O CES tem uma pegada mais para eletrônicos de consumo, que começou com aparelhos de rádio e TV mas que atualmente inclui, dentre outros, drones, automóveis e robôs. Já o MWC reúne os produtores de celulares e empresas de telecomunicações, mas que também abre espaço para as soluções de software disponíveis nos mais diversos dispositivos móveis.

Quem quiser relembrar o que foi destaque na CES este ano pode dar uma conferida em [6], [7] e [8], enquanto que um apanhado dos lançamentos no MWC pode ser visto em [9]. Um ultra-resumo dos 2 eventos poderia ser: A casa do futuro, com diversas “coisas” inteligentes interligadas, já é uma realidade e até o final do ano contará também com celulares com telas dobráveis acessando a rede 5G (em cidades selecionadas).

O problema de ultra-resumos é que fica muita coisa de fora, especialmente tomando como base apenas 2 eventos, mesmo que eles sejam grandes e abrangentes. Quem trabalha com varejo dirá que novidades mesmo estão na NRF, enquanto que a turma mais criativa dirá que não se pode deixar de considerar o SXSW, ambos os eventos também no inicio do ano. Em todos eles, contudo, tem sido crescente o surgimento de novas soluções incorporando CD e IA, muitas vezes ocupando a maior parte do espaço de suas respectivas coberturas jornalisticas. Até no Fórum Econômico Mundial, em Davos, a tecnologia ganha cada vez mais destaque, tendo sido o espaço escolhido este ano para divulgação da Declaração Digital, conforme relata o artigo “Era 5G exige responsabilidade e ética digital” [10].

O que pode passar desapercebido, mesmo tendo sido noticiado, são as disputas acontecendo em paralelo a estes eventos. Em “A heated battle between the US and China played out at the world’s biggest mobile event” [11], é descrita a verdadeira batalha sendo travada entre EUA e China pela liderança da corrida tecnológica, com foco em IA. Para os mais antenados não será novidade as sucessivas denuncias sendo feitas pelo governo norte-americano contra a empresa chinesa Huawei, com o mais recente round tendo sido travado justamente no MWC. O presidente Trump chegou até mesmo a fazer declarações curiosas, dizendo que tecnologia boa mesmo será a internet 6G, meio que tentando desqualificar as tecnologias 5G.

Quem quiser entender melhor o 5G e também as razões desta disputa entre EUA e China, deve conferir o artigo “The Real Reason America Is Scared of Huawei: Internet-Connected Everything” [12], mas para conhecer as iniciativas/investimentos que estes 2 países estão fazendo nesta área, a dica é ler “Who will lead in the age of artificial intelligence?” [13].

Como os Governos estão usando a Tecnologia

Falar de tendencias tecnológicas pode, muitas vezes, parecer abstrato e distante do nosso dia a dia. Nem sempre nos damos conta da quantidade de tecnologias que já estão ao nosso redor, mudando nossa realidade.

Por conta disto, é interessante apresentar casos concretos do uso destas tecnologias no presente. Na Finlândia, o governo tem um projeto ambicioso e já esta desenvolvendo um assistente digital para seus cidadãos. A iniciativa é descrita em “Meet Aurora: Finland’s AI assistant aims to give each citizen tailored advice” [14]. Na Índia, câmeras de transito e IA estão ajudando o governo a identificar motoristas sem cinto de segurança ou sem capacete, de acordo com “Cameras with AI to detect helmet-less riders, drivers without seatbelt in Kerala” [15].

Dos EUA temos o artigo “Open data, AI apps shine at Census demo day” [16] descrevendo uma iniciativa para estimular o uso de dados públicos em aplicações para beneficiar o governo e a população. Aqui no Brasil, com um novo censo geral previsto para 2020, esta é uma iniciativa que pode ser copiada. Mas temos também exemplos concretos para apresentar, como é o caso do Conselho Nacional de Justiça, que esta criando um laboratório de inteligência artificial com foco no desenvolvimento de soluções de ponta para os processos judiciais eletrônicos [17].

Um exemplo curioso, entretanto, vem da China. O artigo “Is China’s corruption-busting AI system ‘Zero Trust’ being turned off for being too efficient?” [18] fala de um sistema já sendo utilizado experimentalmente em diversas municipalidades para identificar funcionários públicos corruptos tomando como base compras públicas e movimentações financeiras. O texto descreve outros usos de tecnologia pelo governo chinês, incluindo o uso de blockchain para não permitir que funcionários com acesso privilegiado possam alterar dados críticos em sistemas governamentais (p.e., para apagar multas ou diminuir seu valor). Apesar do título da matéria maldosamente sugerir que as tecnologias anticorrupção estão sendo desligadas por serem demasiadamente eficientes, o próprio texto explica que muitas vezes o sistema é capaz de indicar um suspeito, sem no entanto apresentar com detalhes as evidências que o levaram a chegar a esta conclusão. É preciso mesmo ter cuidado ao apontar corruptos num país onde a punição para isto pode ser a morte, pelo menos enquanto estas tecnologias não forem aperfeiçoadas.

Os Desafios para Empresas de Tecnologia

Quem fornece as novas tecnologias para os governos ? Ou para os negócios em geral ? Ainda que muitos países possam recorrer a empresas estatais, nem mesmo na China a regra é esta. Por outro lado, a velocidade da evolução tecnológica tem imposto desafios mesmo para grandes empresas de base tecnológica. Uma referência tratando exatamente disto é “11 grandes problemas que a TI enfrentará em 2019” [19], listando preocupações que estarão presentes em qualquer empresa que faça uso das tecnologias da informação e comunicação. São eles, resumidamente: Segurança, ambientes multicloud, falta de profissionais qualificados, terceirização e transformação digital.

A falta de pessoal qualificado é um problema global, conforme ilustra o artigo “Computer Science Demand Is Soaring Due To Tech Bubble 2.0” [20]. A procura por cursos de ciência da computação está muito grande, coisa que já aconteceu no passado e que fez com que a disputa por vagas em cursos de informática fosse muito acirrada, levando a uma percepção geral de que eram cursos difíceis. Daí a preocupação de alguns governos em estimular a abertura de mais vagas para cursos deste tipo. Até porque, segundo o texto “Too few cybersecurity professionals is a gigantic problem for 2019″[21], existe hoje um deficit de 3 milhões de profissionais qualificados em segurança da informação. É o tipo de profissional que não poderá faltar nem no setor público e muito menos no setor privado. Vejam com a China esta lidando com isto em “In China, the fight for AI supremacy starts with the young” [22].

Já a questão dos ambientes multicloud é um dos tópicos abordados no relatório “The Future Of Data Centers” [23], que trata também da computação na borda (Edge Computing) e trás detalhes de como o mercado de Data Centers está se expandido fortemente no mundo. Interessante perceber que alguns países do norte da Europa estão criando políticas específicas para este tipo de negócio, barateando os impostos e garantindo insumos mais em conta, sendo o maior deles a energia elétrica.

Países frios levam vantagem pois exigem menor consumo de energia para resfriamento da infraestrutura computacional. Existem pesquisas específicas sobre centros de dados submersos, tirando proveito das baixas temperaturas dos oceanos. Esta é uma área na qual o Brasil poderia tirar proveito do conhecimento da Petrobras em exploração em águas profundas e da situação geográfica, por exemplo, de Cabo Frio, até porque não temos neve em quantidade aqui por estas bandas. Mas o custo da energia por aqui precisaria também ser “melhorado”, assim como os impostos sobre Telecom. Sem data centers locais e com custo acessível teremos problemas para tirar proveito destas novas tecnologias fortemente baseadas em dados.

Tendencias em CD e IA

Conforme prometido, apresento agora as principais tendencias tecnológicas relacionadas com Ciência de Dados e Inteligencia Artificial, aproveitando para esclarecer que o ramo da IA chamado Aprendizado de Máquina (Machine Learning) tem uma especialização denominada Aprendizado Profundo (Deep Learning) e que ambos dependem fortemente de dados para conseguir produzir resultados significativos. É por esta razão que entendemos ser importante juntar CD e IA, muito embora estas áreas do conhecimento não precisem estar sempre juntas.

Se o parágrafo acima lhe permitiu novos aprendizados, você definitivamente deve dar uma conferida no artigo da Forbes “5 Important Artificial Intelligence Predictions (For 2019) Everyone Should Read” [24], pois ele faz previsões para não especialistas, destacando:

• A IA estará no centro de disputas internacionais – se você esta lendo este texto desde o início já sabe o porque
• A IA se tornará mais transparente – Muito em função de novas legislações, como é o caso da LGPD aqui no Brasil
• O uso da IA vai se aprofundar na maioria dos negócios – Até o ano passado as empresas estavam organizando melhor seus dados, montando equipes próprias e entendendo o que a IA consegue ou não entregar. 2019 será o ano para pisar no acelerador
• A quantidade de postos de trabalho gerados pela IA será maior do que os que serão fechados pelo seu uso – No curto prazo existem pesquisas mostrando isto, mas esta previsão pode mudar no médio e longo prazo
• Os assistentes digitais que usam IA se tornarão realmente úteis – já que muitos ainda os consideram “engraçadinhos” mas dispensáveis

Um outro artigo da mesma revista, “7 Takeaways From Recent Surveys About The State-Of-Artificial Intelligence (AI)” [25], reforça a previsão sobre as empresas pisarem no acelerador em relação a IA, trazendo estatísticas que mostram o crescimento constante na adoção desta tecnologia. Contudo, não são poucos os desafios que devem ser enfrentados, mas curiosamente quem já esta lidando com isto aponta que 95% das barreiras encontradas se referem a desafios culturais (pessoas e processos), com os 5% restantes sendo relacionados a tecnologia propriamente dita. Daí que empresas que forem iniciar projetos deste tipo, enfrentando a assim chamada Transformação Digital, devem não apenas buscar os fornecedores das novas tecnologias mas também considerar a contratação de consultores/mentores que possam auxiliar a organização nesta jornada.

Quem já é do ramo de CD e/ou IA talvez prefira previsões mais detalhadas, sem necessariamente perder abrangência. Se este é o seu caso, minha recomendação é a leitura de “Artificial Intelligence and Data Science Advances in 2018 and Trends for 2019” [26]. É um artigo bem completo, inclusive tratando da adoção de CD e IA em diferentes indústrias. Um outro artigo mais curto e objetivo é “5 Predictions about Data Science, Machine Learning, and AI for 2019” [27]. Segundo o seu autor, William Vorhies, são elas:

• Dados se tornarão mais importantes do que Algorítimos;
• Tudo ficará mais fácil na medida em que as plataformas analíticas genéricas serão substituídas por aplicações com foco em processos específicos (facilitando a adoção de IA)
• A ascensão dos Engenheiros de Dados e Analistas de Dados, seja pela carência dos Cientistas de Dados, seja pela automação crescente em CD e IA
• Neuromorphic Chips: IA chegará na borda (Edge) por conta da Internet das Coisas
• Diferentes Frameworks de IA aprenderão a conversar entre si, muito por conta do ONMX – Open Neural Network Exchange

Agora, se você valoriza uma opinião mas acha que previsões devem ser extraídas de um conjunto de opiniões, não deixe então de conferir [28] e [29].

É no início do ano que o Gartner também atualiza sua análise sobre as plataformas de CD e IA, com direito a análise da análise no artigo “Gainers, Losers, and Trends in Gartner 2019 Magic Quadrant for Data Science and Machine Learning Platforms” [30]. Vários dos fornecedores mencionados disponibilizam em seus portais o acesso para o relatório original do Gartner. Um destes links está disponível em [31].

Ao tratar de tendências e previsões não podemos deixar de apresentar, também, aquelas que funcionam como contraponto. Não se pode negar que várias personalidades já manifestaram suas preocupações em relação a IA e aos malefícios que poderiam surgir da sua aplicação indiscriminada. Até por conta deste clima, uma noticia recente acabou criando um debate acalorado em todo o mundo. Um exemplo de como a noticia repercutiu aqui no Brasil pode ser visto em “Nova Inteligência Artificial é tão avançada que cientistas a consideram perigosa” [32].

A nota para a imprensa divulgada pela OpenAI, organização sem fins lucrativos dos EUA, trazia informações sobre seu novo algorítimo GPT-2 para geração de textos, capaz de produzir conteúdo de melhor qualidade se comparado com outros algorítimos semelhantes. A própria organização declarou ainda que por conta deste tipo de tecnologia estar sendo usado para gerar noticias enganosas, tendenciosas ou mesmo falsas (fake news), ela não iria publicar detalhes sobre o algorítimo, os dados utilizados para treiná-lo e os parâmetros para calibragem do modelo, contrariando decisões anteriores de publicar como software aberto e na integra, algorítimos previamente desenvolvidos.

Daí que a imprensa inferiu que a decisão era por conta do perigo associado ao próprio algorítimo, resultando numa repercussão imensa que suscitou inclusive acusações de que a organização teria manipulado os jornalistas para conseguir uma maior audiência, muito embora outros tantos tenham enxergado um certo despreparo de profissionais de comunicação para lidar com conteúdo tão especializado. Todo o episódio esta bem detalhado e explicado no artigo “Who’s afraid of OpenAI’s big, bad text generator?” [33].

Isto não significa que a IA não inspire cuidados que precisem ser corretamente endereçados. O artigo “Why A.I. Is a Threat to Democracy — and What We Can Do to Stop It” [34] é ao mesmo tempo uma entrevista com a professora da NYU e Futurista Amy Webb, e uma resenha do seu mais recente livro “The Big Nine: How the Tech Titans and Their Thinking Machines Could Warp Humanity”. Segundo a autora, o domínio tecnológico de 9 grandes empresas atuando com IA e em busca de recompensas de curto prazo, seja por conta do modelo capitalista, seja por orientação de um governo dominante, colocam novamente a disputa entre EUA e China no centro do palco. Pelo lado dos EUA temos a G-MAFIA, iniciais da Google, Microsoft, Amazon, Facebook, IBM, e Apple. Pelo lodo chines temos a Tencent, Alibaba, e Baidu. Qual a recomendação para evitar desastres possíveis ? Ser mais consciente ao compartilhar seus próprios dados e autorizar terceiros a utilizá-los, coisa que qualquer um pode fazer desde já.

Um outro relatório que também avalia os impactos da IA na sociedade em geral, inclusive chamando a atenção para o fato de que o impacto desta tecnologia não será homogêneo, tem como título “Countering the geographical impacts of automation: Computers, AI, and place disparities” [35]. Ao final são apresentadas algumas recomendações sobre politicas públicas para antecipar os efeitos da tecnologia em regiões com maior propensão de serem negativamente impactadas.

Se a IA pode muito, ela certamente não pode tudo. Assim, por mais que governos acumulem cada vez mais dados sobre seus cidadãos e suas atividades, na esperança de que os algorítimos de IA serão capazes de resolver qualquer problema num futuro próximo, o mais provável é que muitos dos problemas continuem em aberto. É o que defende o professor da Universidade de Chicago e ganhador de um premio Nobel de Economia, Lars Peter Hansen, no artigo “Purely evidence-based policy doesn’t exist” [36]. A tese é de certo modo reforçada por um outro artigo recente na revista Nature, cujo título é “Unprovability comes to machine learning” [37].

Isto não significa, de modo algum, que a IA não tenha serventia ou que não seja capaz de resolver importantes problemas. Nos lembram apenas que a tecnologia não pode tudo e que nem por isto devemos ficar de braços cruzados até que apareça uma tecnologia definitiva capaz de resolver perfeitamente e sem quaisquer sequelas os problemas que nos afligem.

Previsões para o Brasil

Mesmo nos artigos publicados aqui em Português sobre tendencias tecnológicas, quase nunca aparece uma previsão sobre alguma tecnologia nacional se tornando uma tendencia em escala internacional. No universo das startups já temos por aqui algumas crias brasileiras abrindo capital no exterior e entrando no clube dos Unicórnios (empresas cujo valor estimado supera 1 bilhão de dólares), mostrando que existe capacidade local.

O custo Brasil é no entanto um obstáculo que precisa ainda ser enfrentado e que é comparativamente maior do que as condições enfrentadas por startups em outras economias ao redor do mundo. Não estamos no final da fila mas ainda muito distantes das posições iniciais, principalmente se compararmos a posição do nosso país no ranking das maiores economias mundiais.

Como referencia para tentar produzir previsões sobre CD e IA aqui para o Brasil selecionei os seguintes artigos/reportagens:
• LGPD promete tornar o Brasil o país mais auditado do mundo [38]
• Mais de 30% das empresas brasileiras admitem não proteger dados de clientes e funcionários [39]
• A Inteligência Artificial pode tirar empregos; o que o Brasil deve fazer? [40]
• ANATEL marca Leilão de 5G para março de 2020 [41]
• Serpro abre consulta para comprar plataforma de Inteligência Artificial [42]
• Em Março, a PGFN terá acesso a dados de cadastro da Serasa para fazer cobranças [43]
• IBM to launch AI research center in Brazil [44]
• Brasil terá centro de fomento de AI e cibersegurança, adianta Pontes [45]

Pelo lado positivo, o Brasil claramente não esta parado e algumas iniciativas podem render frutos. Do ponto de vista do cidadão, a LGPD – Lei Geral de Proteção de Dados é um alento e a criação de uma Agencia de Proteção de Dados poderá fazer diferença ao garantir seus direitos e impor obrigações para quem coletar e operar dados em geral. Mas a Lei trata o governo de forma diferenciada, deixando ainda brechas para continuarmos testemunhando a venda no mercado negro de bases de dados com informações públicas que não deveriam estar disponíveis por conterem informações sigilosas.

Com um nível tão elevado de desemprego e com a economia ainda em recuperação, considerando ainda a referência [24] que diz que a IA será uma geradora de empregos no curto prazo, o mais provável é que falte dinheiro para investimentos significativos em qualquer area este ano, fazendo com que a discussão sobre o desemprego causado pela IA no Brasil fique bem mais para a frente.

Talvez até para depois do leilão do 5G. Aliás, como a referência [12] bem explica, o 5G exigirá mais investimentos em equipamentos e será fundamental para transportar os dados com a velocidade e volume necessários para viabilizar as aplicações móveis/distribuídas usando IA. Uma previsão legal para ser feita é que nos preparativos para o leilão de 5G aqui no Brasil será debatida uma alteração de estratégia, deixando de priorizar a arrecadação de recursos no curto prazo (para ajudar a equilibrar o déficit público) e passando a considerar o volume de investimentos para viabilizar a operação da nova rede no maior número possível de municipios como critério para consessão das frequencias. Aí sim poderemos começar a ver investimentos externos volumosos a partir de 2020. Consequentemente, teremos inúmeras oportunidades de emprego surgindo, mas muito provavelmente faltará mão de obra qualificada para ocupá-los, obrigando a um planejamento de investimentos mais espaçados ao longo do tempo.

Não faltarão oportunidades relacionadas com compras públicas de plataformas de ciência de dados por diferentes orgão de governo e estatais. Haverão também parcerias criativas como aquela descrita em [43], gerando divergencias de opiniões já que a tecnologia trás desafios também no que diz respeito a sua legislação e regulação.

Algumas empresas da G-MAFIA, e também as chinesas (ver [34]), vão abrir por aqui centros de P&D em IA, até porque precisarão treinar localmente a turma que vai operar suas respectivas soluções sendo oferecidas nas licitações públicas. Infelizmente o nível do investimento nestes centros será muito menor do que é feito nas respectivas matrizes. Usando como referencia o valor do investimento reportado em [44], ele é 100 vezes menor do que o investimento sendo feito pela mesma empresa em um dos seus novos centros no seu país de origem, no que estão absolutamente corretos. Não creio que seja também cabível qualquer reclamação em relação a isto, até porque devemos buscar incentivar o maior número possível de investimentos externos no país, inclusive nos empenhando para apresentar resultados que justifiquem novos investimentose a ampliação daqueles que já foram feitos. Mas é preciso ficar atento para criar politicas públicas que nos permitam, como país, tirar o melhor e máximo proveito destas oportunidades.

A verdade é que o centro de fomento de AI e cibersegurança anúnciado pelo Ministro Pontes não deveria ser somente um, mas vários em diferentes regiões do país. Não de forma redundante, mas coordenados e buscando as sinergias que poderão potencializar as diferentes iniciativas locais e gerar resultados mais consistentes e em menor espaço de tempo.

Reconhecendo todo o mérito que São Paulo tem para sediar um centro como o anunciado, contando inclusive com uma FAPESP com uma situação financeira privilegiada, e a maioria das sedes das empresas multinacionais com filiais no país, entendemos que as iniciativas já em curos por lá devem continuar a ser estimuladas.

Por outro lado, a articulação em torno da rede de Ciência de Dados e Inteligencia Artificial do Estado do Rio de Janeiro, criada em maio de 2017 com representantes de diferentes esferas de governo, academia e iniciativa privada, é prova de que existe aqui massa critica desenvolvendo projetos relevantes e com grande capacidade de formação contínua de mão de obra qualificada. Como senão, apenas os obstaculos adicionais relacionados com o enfraquecimento economico do estado, que ainda assim não paralizaram os inúmeros projetos em andamento e que tem sido compartilhados nos Seminários sobre CD e IA realizados durante o evento Rio Info nos últimos 2 anos. Assim, já começamos a nos organizar para mostrar para o ministro Pontes que um centro de fomento de IA e cibersegurança também no Rio de Janeiro faz todo o sentido.

Os links para todas as referências feitas aqui estão disponíveis mais abaixo. Logo em seguida apresentamos outras sugestões de leitura organizadas em diferentes seções. Para quem se animou a aprender mais sobre ciência de dados e IA não deixe de conferir a seção “Primeiros Passos”. Os que já se converteram e buscam aperfeiçoar seus conhecimentos devem dar uma conferida em “Modelos, técnicas e ferramentas” ou “Dados e Repositórios”. Ainda não é exatamente o que você estava procurando? Confira as demais seções e nos diga o que esta faltando