TORIma Academia Logo TORIma Academia
História da inteligência artificial (History of artificial intelligence)
Tecnologia

História da inteligência artificial (History of artificial intelligence)

TORIma Academia — História do computador

History of artificial intelligence

História da inteligência artificial (History of artificial intelligence)

A história da inteligência artificial (IA) começou na antiguidade, com mitos, histórias e rumores de seres artificiais dotados de inteligência ou…

A história da inteligência artificial (IA) tem origem na antiguidade, marcada por mitos, narrativas e lendas sobre entidades artificiais imbuídas de intelecto ou consciência por artesãos qualificados. O estudo contínuo da lógica e do raciocínio formal, desde a antiguidade até o presente, culminou no desenvolvimento do computador digital programável na década de 1940, um dispositivo baseado em princípios matemáticos abstratos. Esta invenção, juntamente com seus fundamentos conceituais, motivou os cientistas a contemplar a criação de um cérebro eletrônico.

A disciplina de pesquisa em IA foi formalmente estabelecida durante um workshop realizado no Dartmouth College em 1956. Durante este evento, o programa inaugural de IA, Logic Theorist, foi apresentado por Allen Newell, um futuro ganhador do Prêmio Turing, e Herbert A. Simon, que mais tarde receberia o Prêmio Nobel, com contribuições de J. C. Shaw. Os participantes deste workshop seminal emergiram posteriormente como figuras proeminentes na investigação da IA ​​durante várias décadas. Um número significativo destes pioneiros previu o surgimento de máquinas inteligentes de nível humano dentro de uma única geração. Consequentemente, o governo dos EUA atribuiu financiamento substancial, no valor de milhões de dólares, na prossecução da realização deste objectivo ambicioso.

Subsequentemente, tornou-se evidente que os investigadores tinham subestimado significativamente a natureza complexa deste objectivo. Em 1974, as críticas de James Lighthill, juntamente com a pressão do Congresso dos EUA, levaram os governos dos EUA e do Reino Unido a cessar o financiamento para pesquisas não direcionadas em inteligência artificial. Sete anos depois, uma iniciativa inovadora do governo japonês, juntamente com a eficácia demonstrada dos sistemas especializados, revitalizou o investimento em IA. No final da década de 1980, o setor havia se expandido para uma indústria multibilionária. No entanto, o entusiasmo dos investidores diminuiu durante a década de 1990, levando a críticas da mídia ao campo e à sua evitação pela indústria, um período coloquialmente denominado "inverno da IA". Apesar destes contratempos, a investigação e o apoio financeiro persistiram, muitas vezes sob designações alternativas.

Durante o início dos anos 2000, a aprendizagem automática encontrou ampla aplicação em diversos desafios académicos e industriais. Este sucesso resultou da confluência de hardware computacional poderoso, da acumulação de vastos conjuntos de dados e da implementação de metodologias matemáticas rigorosas. Pouco tempo depois, o deep learning surgiu como uma tecnologia transformadora, superando os métodos anteriores. A arquitetura do transformador, introduzida em 2017, foi posteriormente utilizada para desenvolver aplicações generativas de IA, entre outras implementações.

O investimento em inteligência artificial registou um aumento significativo na década de 2020. Esta recente expansão, catalisada pelo avanço da arquitetura do transformador, facilitou o rápido dimensionamento e a implantação pública de grandes modelos de linguagem (LLMs), como o ChatGPT. Estes modelos demonstram atributos humanos de conhecimento, atenção e criatividade, e foram incorporados em numerosos setores, impulsionando assim o investimento exponencial em IA. Ao mesmo tempo, surgiram apreensões relativamente aos perigos potenciais e às ramificações éticas da IA sofisticada, provocando uma discussão generalizada sobre a trajetória futura da IA e as suas consequências sociais.

Antecedentes

Mitologia, folclore, narrativas ficcionais e pensamento especulativo

Humanóides mecânicos e entidades artificiais são proeminentes na mitologia grega, exemplificadas pelos robôs dourados de Hefesto, o gigante de bronze Talos e Galatea de Pigmalião. Durante a Idade Média, circularam lendas sobre métodos místicos ou alquímicos clandestinos para imbuir a matéria com consciência, incluindo o Takwin de Jabir ibn Hayyan, o homúnculo de Paracelsus, o Golem do Rabino Judah Loew e a cabeça de bronze de Roger Bacon. No século 19, os conceitos de humanos artificiais e máquinas sencientes tornaram-se um tema predominante na literatura. Obras significativas incluem Frankenstein de Mary Shelley (1818), Fausto, Parte Dois de Johann Wolfgang von Goethe (1832) e R.U.R. (Robôs Universais de Rossum) (1921). As narrativas que cercam estas criações e os seus destinos exploram frequentemente muitas das mesmas aspirações, ansiedades e dilemas éticos colocados pela inteligência artificial contemporânea. Além disso, tópicos pertinentes à IA foram examinados em ensaios especulativos, como "Darwin entre as Máquinas" de Samuel Butler (1863).

Autômatos

Autômatos humanóides altamente realistas foram construídos por artesãos de diversas civilizações, incluindo Yan Shi, Herói de Alexandria, Al-Jazari, Haroun al-Rashid, Jacques de Vaucanson, Leonardo Torres y Quevedo, Pierre Jaquet-Droz e Wolfgang von Kempelen. Os primeiros autômatos documentados eram efígies sagradas do antigo Egito e da Grécia. Os adeptos acreditavam que essas figuras foram dotadas de intelecto genuíno e capacidade emocional por seus criadores. Hermes Trismegisto afirmou notavelmente que “ao descobrir a verdadeira natureza dos deuses, o homem foi capaz de reproduzi-la”.

Raciocínio formal

A inteligência artificial opera com base na premissa de que os processos de pensamento humano são passíveis de mecanização. No primeiro milénio a.C., filósofos chineses, indianos e gregos estabeleceram abordagens sistemáticas ao raciocínio formal. A lógica formal foi originada e posteriormente refinada por filósofos gregos, islâmicos e europeus, incluindo figuras como Aristóteles, Euclides, Al-Khwarizmi, Duns Scotus e René Descartes.

O filósofo espanhol Ramon Llull (1232–1315) concebeu várias máquinas lógicas projetadas para gerar conhecimento através de processos lógicos. Ele caracterizou essas máquinas como construções mecânicas capazes de sintetizar verdades fundamentais e irrefutáveis ​​através de operações lógicas elementares, gerando assim mecanicamente todo o conhecimento concebível. O trabalho de Lúlio influenciou significativamente Gottfried Leibniz, que desenvolveu ainda mais estes conceitos.

Durante o século XVII, Leibniz, Thomas Hobbes e René Descartes investigaram o potencial de todo pensamento racional ser sistematizado com a precisão da álgebra ou da geometria. Hobbes afirmou em Leviatã: "Por razão... nada mais é do que cálculo, isto é, somar e subtrair." Leibniz propôs uma linguagem universal para o raciocínio, a characteristica universalis, destinada a transformar a argumentação em mero cálculo para que "não houvesse mais necessidade de disputa entre dois filósofos do que entre dois contadores. Pois bastaria pegar seus lápis nas mãos, até as lousas, e dizer um ao outro (com um amigo como testemunha, se quisessem): Vamos calcular."

Boole's As Leis do Pensamento (1854) e o Begriffsschrift de Frege (1879) estabeleceram a estrutura contemporânea da lógica matemática simbólica. Ampliando a estrutura de Frege, Russell e Whitehead ofereceram uma exposição formal dos princípios fundamentais da aritmética no Principia Mathematica em 1913. Inspirado por seu sucesso, David Hilbert levou os matemáticos durante as décadas de 1920 e 1930 a formalizar a totalidade do raciocínio matemático. Em resposta, a prova da incompletude de Gödel, a máquina de Turing e o cálculo Lambda de Church demonstraram coletivamente as limitações inerentes da matemática formal.

No entanto, dentro destes limites estabelecidos, a tese de Church-Turing sugeriu que um aparato mecânico, manipulando símbolos tão elementares como 0 e §23§, poderia emular qualquer processo imaginável de raciocínio matemático ou resolução de problemas. Central para isso foi a máquina de Turing, uma construção teórica simples que encapsulava a natureza fundamental da manipulação de símbolos abstratos. Este dispositivo conceitual e seus princípios subjacentes motivaram posteriormente engenheiros e matemáticos na década de 1940 a construir máquinas teoricamente capazes de executar qualquer forma de raciocínio formal ou resolução de problemas.

Ciência da Computação

Ao longo da história, desde a antiguidade, numerosos indivíduos projetaram ou construíram máquinas de calcular, incluindo Gottfried Leibniz, Joseph Marie Jacquard, Charles Babbage, Percy Ludgate, Leonardo Torres Quevedo e Vannevar Bush, entre outros. Ada Lovelace postulou que o aparato de Babbage constituía "uma máquina pensante ou ... de raciocínio", mas advertiu: "É desejável se proteger contra a possibilidade de ideias exageradas que surgem quanto aos poderes" da máquina.

Os computadores modernos iniciais surgiram como máquinas de grande escala durante a Segunda Guerra Mundial, exemplificados por Z3 de Konrad Zuse, Heath Robinson e Colossus de Tommy Flowers, ABC de Atanasoff e Berry e ENIAC na Universidade da Pensilvânia. O ENIAC baseou-se na base teórica estabelecida por Alan Turing e foi desenvolvido por John von Neumann, tornando-se finalmente o mais influente.

Nascimento da Inteligência Artificial (1941–1956)

As primeiras investigações sobre máquinas inteligentes foram catalisadas por uma convergência de conceitos que ganharam destaque desde o final da década de 1930 até o início da década de 1950. Estudos neurológicos contemporâneos revelaram que o cérebro é uma rede elétrica de neurônios operando por meio de impulsos de tudo ou nada. O trabalho de Norbert Wiener sobre cibernética elucidou princípios de controle e estabilidade em redes elétricas. A teoria da informação de Claude Shannon caracterizou os sinais digitais, especificamente aqueles que operam numa base de tudo ou nada. A teoria computacional de Alan Turing demonstrou a representabilidade digital de qualquer processo computacional. A relação sinérgica entre essas diversas ideias implicava o potencial para a construção de um “cérebro eletrônico”.

Durante as décadas de 1940 e 1950, um grupo diversificado de cientistas de disciplinas como matemática, psicologia, engenharia, economia e ciências políticas iniciou vários caminhos de investigação que se revelaram cruciais para o desenvolvimento subsequente da inteligência artificial (IA). Alan Turing foi um pioneiro no exame rigoroso do potencial teórico da “inteligência de máquina”. A disciplina acadêmica de "pesquisa em inteligência artificial" foi formalmente estabelecida em 1956.

O Teste de Turing

Em 1950, Turing escreveu o artigo seminal "Computing Machinery and Intelligence", onde explorou a viabilidade do desenvolvimento de máquinas capazes de pensar. Neste trabalho, ele reconheceu os desafios de definição de “pensar” e posteriormente propôs seu renomado teste de Turing: uma máquina poderia ser considerada “pensante” se pudesse se envolver em uma conversa baseada em teleimpressora indistinguível de uma conversa com um ser humano. Esta estrutura simplificada permitiu a Turing afirmar de forma persuasiva que uma “máquina pensante” era pelo menos plausível, com o artigo a abordar objecções prevalecentes a este conceito. O teste de Turing representou a proposição inicial significativa dentro da filosofia da inteligência artificial.

Redes Neurais Artificiais

Em 1943, Walter Pitts e Warren McCulloch conduziram uma análise de redes de neurônios artificiais idealizadas, demonstrando sua capacidade de executar funções lógicas básicas. Eles foram os primeiros a articular o conceito que os pesquisadores subsequentes identificariam como uma rede neural. Sua publicação inspirou-se no artigo de Turing de 1936, "On Computable Numbers", ao empregar 'neurônios' booleanos de dois estados análogos, mas aplicou essa estrutura de maneira única à função neuronal. Marvin Minsky, então um estudante de pós-graduação de 24 anos, estava entre os influenciados por Pitts e McCulloch. Em 1951, Minsky colaborou com Dean Edmonds para construir o SNARC, a máquina de rede neural inaugural. Mais tarde, Minsky emergiu como um líder importante e inovador no campo da Inteligência Artificial.

Robótica Cibernética

Durante a década de 1950, foram desenvolvidos robôs experimentais, incluindo as "tartarugas" de William Gray Walter e a "Besta da Johns Hopkins". Esses dispositivos operavam sem computadores, eletrônica digital ou raciocínio simbólico, contando exclusivamente com circuitos analógicos para seu controle.

Inteligência Artificial de Jogos

Em 1951, Christopher Strachey desenvolveu um programa de damas e Dietrich Prinz criou um programa de xadrez, ambos utilizando a máquina Ferranti Mark 1 da Universidade de Manchester. O programa de damas de Arthur Samuel, documentado em seu artigo de 1959 "Alguns estudos em aprendizado de máquina usando o jogo de damas", finalmente atingiu um nível de proficiência capaz de desafiar um amador competente. O programa de Samuel representa uma das primeiras aplicações do que seria posteriormente denominado aprendizado de máquina. Ao longo da história da IA, a IA dos jogos serviu consistentemente como referência para avaliar o progresso.

Raciocínio Simbólico e o Teórico da Lógica

Com o advento dos computadores digitais em meados da década de 1950, certos cientistas compreenderam intuitivamente que máquinas capazes de manipulação numérica também podiam processar símbolos e que tal manipulação simbólica poderia constituir a natureza fundamental da cognição humana. Esse insight marcou uma nova metodologia para a construção de máquinas inteligentes.

Em 1955, Allen Newell e o futuro ganhador do Nobel Herbert A. Simon, auxiliados por J. C. Shaw, desenvolveram o "Teórico da Lógica". Este programa provou com sucesso 38 dos 52 teoremas iniciais apresentados no Principia Mathematica de Russell e Whitehead e, adicionalmente, descobriu provas novas e mais elegantes para vários deles. Simon afirmou que eles haviam "resolvido o venerável problema mente/corpo, explicando como um sistema composto de matéria pode ter as propriedades da mente". O paradigma de raciocínio simbólico iniciado por eles tornou-se a abordagem predominante na investigação e financiamento da IA até meados da década de 1990, inspirando simultaneamente a revolução cognitiva.

Oficina de Dartmouth

O workshop de Dartmouth, realizado em 1956, representou um momento crucial, estabelecendo formalmente a inteligência artificial (IA) como uma disciplina acadêmica. Marvin Minsky e John McCarthy organizaram este evento, recebendo apoio dos cientistas seniores Claude Shannon e Nathan Rochester da IBM. A proposta da conferência articulava a intenção de validar a afirmação de que “cada aspecto da aprendizagem ou qualquer outra característica da inteligência pode ser descrito com tanta precisão que uma máquina pode ser feita para simulá-la”. John McCarthy introduziu o termo “Inteligência Artificial” durante este workshop. Os principais participantes incluíram Ray Solomonoff, Oliver Selfridge, Trenchard More, Arthur Samuel, Allen Newell e Herbert A. Simon, todos os quais desenvolveriam programas significativos nas décadas iniciais de pesquisa em IA. No workshop, Newell e Simon revelaram o "Teórico da Lógica". Este evento é amplamente considerado como a gênese da IA, fornecendo ao campo seu nome, missão, grande sucesso inicial e figuras fundamentais.

Revolução Cognitiva

No outono de 1956, Newell e Simon também apresentaram o Logic Theorist em uma reunião do Grupo de Interesse Especial em Teoria da Informação, realizada no Instituto de Tecnologia de Massachusetts (MIT). Durante a mesma reunião, Noam Chomsky discutiu sua gramática generativa e George Miller apresentou seu artigo seminal, "O número mágico sete, mais ou menos dois". Miller refletiu mais tarde: "Saí do simpósio com a convicção, mais intuitiva do que racional, de que a psicologia experimental, a linguística teórica e a simulação computacional de processos cognitivos eram todas peças de um todo maior."

Esta reunião iniciou a "revolução cognitiva", uma mudança de paradigma interdisciplinar que abrange psicologia, filosofia, ciência da computação e neurociência. Inspirou o surgimento de vários subcampos, incluindo a inteligência artificial simbólica, a linguística generativa, a ciência cognitiva, a psicologia cognitiva, a neurociência cognitiva e as escolas filosóficas do computacionalismo e do funcionalismo. Todos esses domínios empregavam metodologias relacionadas para modelar a mente, e as descobertas em um campo frequentemente eram relevantes para os outros.

A abordagem cognitiva permitiu aos pesquisadores investigar "objetos mentais", como pensamentos, planos, objetivos, fatos ou memórias, muitas vezes analisando-os por meio de símbolos de alto nível dentro de redes funcionais. Essas construções internas haviam sido anteriormente consideradas “não observáveis” e, portanto, excluídas por paradigmas anteriores como o behaviorismo. Posteriormente, os objetos mentais simbólicos tornaram-se o foco principal da pesquisa e do financiamento da IA durante várias décadas.

Conquistas iniciais (1956–1974)

Os programas desenvolvidos nos anos seguintes ao Workshop de Dartmouth foram amplamente considerados "surpreendentes". Os computadores demonstraram capacidades como resolver problemas de álgebra, provar teoremas de geometria e aprender a falar inglês. Poucos na época acreditavam que tal comportamento “inteligente” da máquina fosse viável. Os investigadores expressaram, privada e publicamente, um intenso optimismo, prevendo a construção de uma máquina totalmente inteligente dentro de duas décadas. Agências governamentais, incluindo a Agência de Projetos de Pesquisa Avançada de Defesa (DARPA, então conhecida como "ARPA"), financiaram significativamente o campo. Laboratórios de Inteligência Artificial foram estabelecidos em diversas universidades britânicas e norte-americanas durante o final dos anos 1950 e início dos anos 1960.

O ensaio filosófico de Stanisław Lem sobre "inteletrônica" apareceu na Summa Technologiae de Lem em 1964.

Metodologias

O final da década de 1950 e a década de 1960 testemunharam numerosos programas bem-sucedidos e novas direções de pesquisa. Entre os mais influentes estavam:

Raciocínio, planejamento e solução de problemas como pesquisa

Muitos dos primeiros programas de IA utilizavam um algoritmo fundamental comum. Para atingir um objectivo específico, como ganhar um jogo ou provar um teorema, estes programas progrediam passo a passo, semelhante a navegar num labirinto, e recuavam ao encontrar um beco sem saída. O principal desafio surgiu do número astronômico de caminhos potenciais através do “labirinto” para muitos problemas, uma situação denominada “explosão combinatória”. Os pesquisadores abordaram isso empregando heurísticas para reduzir o espaço de busca, eliminando assim caminhos que provavelmente não levariam a uma solução.

Newell e Simon tentaram encapsular uma versão generalizada desse algoritmo em um programa chamado "Solucionador Geral de Problemas". Ao mesmo tempo, outros programas baseados em pesquisa alcançaram resultados impressionantes, incluindo a resolução de problemas de geometria e álgebra, como demonstrado pelo Geometry Theorem Prover de Herbert Gelernter (1958) e pelo Symbolic Automatic Integrator (SAINT), desenvolvido pelo aluno de Minsky, James Slagle, em 1961. Além disso, sistemas como o STRIPS, criado em Stanford para controlar o robô Shakey, utilizaram a busca por metas e subobjetivos para planejar ações.

Linguagem Natural

Um objetivo principal da pesquisa em inteligência artificial envolve permitir que os computadores se comuniquem usando línguas naturais, como o inglês. Uma das primeiras conquistas neste domínio foi o programa STUDENT, de Daniel Bobrow, que resolveu com sucesso problemas de álgebra no nível do ensino médio.

Uma rede semântica modela conceitos, como "casa" ou "porta", como nós, e as relações entre esses conceitos, por exemplo "tem-a", como links conectando os nós. Ross Quillian desenvolveu o programa inicial de inteligência artificial para empregar uma rede semântica. A iteração mais impactante, embora controversa, dessa abordagem foi a teoria da Dependência Conceitual de Roger Schank.

O programa ELIZA de Joseph Weizenbaum foi capaz de conduzir conversas com tal verossimilhança que os usuários às vezes acreditavam erroneamente que estavam interagindo com um ser humano em vez de um programa de computador. No entanto, a funcionalidade do ELIZA baseava-se no fornecimento de respostas pré-programadas ou na reformulação da entrada do usuário usando um conjunto limitado de regras gramaticais. ELIZA é reconhecida como o chatbot pioneiro.

Micro-mundos

Durante o final da década de 1960, Marvin Minsky e Seymour Papert, afiliados ao Laboratório de IA do MIT, defenderam o direcionamento da pesquisa em inteligência artificial para cenários deliberadamente simplificados denominados micromundos. Eles observaram que os princípios fundamentais das ciências estabelecidas, como a física, eram frequentemente melhor compreendidos através de modelos simplificados, incluindo planos sem atrito ou corpos perfeitamente rígidos. Uma parte significativa desta pesquisa concentrou-se em um "mundo de blocos", compreendendo blocos coloridos de diversas formas e tamanhos dispostos em uma superfície plana.

Este paradigma de pesquisa promoveu avanços inovadores na visão mecânica, notadamente por Gerald Sussman, Adolfo Guzman, David Waltz (o criador da "propagação de restrições") e, particularmente, Patrick Winston. Ao mesmo tempo, Minsky e Papert construíram um braço robótico capaz de empilhar blocos, atualizando assim o conceito de mundo dos blocos. O sistema SHRDLU de Terry Winograd demonstrou a capacidade de se comunicar sobre o micromundo usando frases naturais em inglês, planejar operações e, posteriormente, executá-las.

Perceptrons e redes neurais iniciais

Ao longo da década de 1960, as agências de financiamento alocaram recursos predominantemente para laboratórios envolvidos em pesquisas simbólicas sobre inteligência artificial; no entanto, um número limitado de instituições continuou a investigar redes neurais.

O perceptron, uma rede neural de camada única, foi introduzida em 1958 por Frank Rosenblatt, um ex-colega de escola de Marvin Minsky na Escola Secundária de Ciências do Bronx. Consistente com o optimismo prevalecente entre os investigadores de IA, Rosenblatt previu o potencial do perceptron, prevendo a sua eventual capacidade de “aprender, tomar decisões e traduzir línguas”. Seu trabalho recebeu apoio financeiro primário do Escritório de Pesquisa Naval. Bernard Widrow e seu aluno Ted Hoff desenvolveram ADALINE (1960) e MADALINE (1962), sistemas com até 1.000 pesos ajustáveis. Ao mesmo tempo, uma equipe do Stanford Research Institute, sob a liderança de Charles A. Rosen e Alfred E. (Ted) Brain, construiu duas máquinas de redes neurais, MINOS I (1960) e MINOS II (1963), apoiadas principalmente pelo Corpo de Sinalização do Exército dos EUA. O MINOS II incorporou 6.600 pesos ajustáveis ​​​​e foi controlado por um computador SDS 910 em configuração designada MINOS III (1968). Este sistema demonstrou capacidade de classificação de símbolos em mapas do exército e de reconhecimento de caracteres impressos à mão em folhas de codificação Fortran. Durante esta fase inicial, a maioria das pesquisas em redes neurais se concentrou na criação e utilização de hardware especializado, em vez de depender de simulações executadas em computadores digitais.

No entanto, o projeto MINOS deixou de receber financiamento em 1966, em parte devido à escassez de resultados demonstráveis ​​e em parte ao cenário competitivo dominado pela investigação simbólica da IA. Da mesma forma, Rosenblatt não conseguiu garantir financiamento sustentado ao longo da década de 1960. Uma queda significativa na pesquisa ocorreu em 1969 com a publicação do livro de Minsky e Papert, Perceptrons. Este trabalho postulou limitações substanciais nas capacidades dos perceptrons e argumentou que as previsões anteriores de Rosenblatt foram consideravelmente exageradas. O impacto do livro foi profundo, levando à cessação quase completa do financiamento para pesquisas sobre conexionismo durante uma década. Consequentemente, a disputa pelo financiamento governamental foi concluída com a ascensão das metodologias simbólicas de IA sobre as redes neurais.

Minsky, um colaborador do SNARC, mais tarde tornou-se um crítico proeminente da IA pura conexionista. Widrow, que trabalhou no ADALINE, redirecionou sua pesquisa para o processamento adaptativo de sinais. Da mesma forma, o grupo SRI, responsável pelo MINOS, mudou o seu foco para a IA simbólica e a robótica.

Um obstáculo significativo foi a incapacidade de treinar redes multicamadas de forma eficaz, apesar de variações de retropropagação terem sido utilizadas noutros campos, sem o conhecimento destes investigadores. A comunidade de IA adquiriu conhecimento da retropropagação na década de 1980, o que posteriormente levou ao sucesso substancial das redes neurais no século 21, cumprindo em última análise as previsões otimistas de Rosenblatt. No entanto, Rosenblatt não viveu para testemunhar estes avanços, pois faleceu num acidente de barco em 1971.

Projeções Otimistas

A geração inaugural de pesquisadores de IA articulou as seguintes previsões sobre seu trabalho:

Financiamento

Em junho de 1963, o Instituto de Tecnologia de Massachusetts (MIT) garantiu uma doação de US$ 2,2 milhões da recém-criada Agência de Projetos de Pesquisa Avançada (ARPA), mais tarde designada como DARPA. Este financiamento foi atribuído ao Projeto MAC, que integrava o “Grupo AI” fundado por Minsky e McCarthy cinco anos antes. Posteriormente, a DARPA forneceu uma quantia anual de US$ 3 milhões até a década de 1970. Além disso, a DARPA estendeu doações comparáveis ao programa de Newell e Simon na Universidade Carnegie Mellon e ao Laboratório de IA da Universidade de Stanford, estabelecido por John McCarthy em 1963. Outro laboratório de IA significativo foi fundado na Universidade de Edimburgo por Donald Michie em 1965. Essas quatro instituições permaneceram como os principais centros acadêmicos para pesquisa e financiamento de IA por muitos anos. ARPA, defendeu o princípio de “financiar pessoas, não projetos!” Esta política capacitou os investigadores a prosseguirem livremente os seus interesses intelectuais. Tal ambiente no MIT fomentou o surgimento da cultura hacker; no entanto, esta metodologia de “intervenção” não foi sustentada indefinidamente.

O primeiro inverno de IA (1974–1980)

Durante a década de 1970, a IA encontrou críticas substanciais e reveses financeiros. Os investigadores de IA subestimaram a dificuldade inerente aos problemas que procuravam resolver. O seu considerável optimismo elevou as expectativas do público a um grau insustentável e, quando os resultados esperados não se concretizaram, o financiamento atribuído à IA foi significativamente reduzido. Esta ausência de sucesso indicou que as técnicas utilizadas pelos investigadores de IA naquela altura eram insuficientes para atingir os objectivos declarados.

No entanto, esses desafios não impediram o crescimento e o avanço geral da área. As reduções de financiamento afectaram principalmente um número limitado de grandes laboratórios e as críticas foram largamente rejeitadas. O interesse público pela IA continuou a expandir-se, o número de investigadores aumentou substancialmente e novos conceitos foram explorados em áreas como a programação lógica, o raciocínio de senso comum e vários outros domínios. Em 2023, o historiador Thomas Haigh afirmou que este período não constituía um “inverno”, enquanto o investigador de IA Nils Nilsson o caracterizou como o momento mais “emocionante” para trabalhar em IA.

Desafios

No início da década de 1970, as capacidades dos programas de IA eram notavelmente restritas. Mesmo os sistemas mais sofisticados só conseguiam resolver versões triviais dos problemas que pretendiam resolver, tornando efetivamente todos os programas como “brinquedos”. Os pesquisadores de IA começaram a enfrentar diversas limitações, algumas das quais só foram superadas décadas depois, enquanto outras continuam a impedir o campo na década de 2020.

O financiamento para pesquisas em IA sofreu um declínio significativo.

As agências de financiamento, incluindo o governo britânico, a DARPA e o Conselho Nacional de Investigação (NRC), ficaram cada vez mais insatisfeitas com o progresso limitado na investigação em IA, acabando por cessar quase todo o apoio financeiro a projectos não dirigidos. Esta tendência começou em 1966 com o relatório do Automatic Language Processing Advisory Committee (ALPAC), que avaliou criticamente os esforços de tradução automática. Após uma despesa de 20 milhões de dólares, o NRC encerrou todo o financiamento para tais iniciativas. Em 1973, o relatório Lighthill, avaliando o estado da investigação em IA no Reino Unido, condenou a incapacidade da IA ​​em cumprir os seus “objectivos grandiosos”, resultando na dissolução dos programas de investigação em IA no país; notavelmente, o relatório citou o problema da explosão combinatória como um fator-chave nas deficiências da IA. A DARPA, expressando profundo desapontamento com os pesquisadores envolvidos no programa Speech Understanding Research da CMU, revogou consequentemente uma doação anual de US$ 3 milhões.

Hans Moravec atribuiu a crise às previsões demasiado optimistas dos seus colegas, afirmando que "muitos investigadores foram apanhados numa teia de exageros crescentes". Ao mesmo tempo, a Emenda Mansfield de 1969 obrigou a DARPA a priorizar a “pesquisa direta orientada para a missão” em vez da “pesquisa básica não dirigida”. Consequentemente, a DARPA deixou de financiar a investigação criativa e exploratória predominante na década de 1960, redireccionando recursos para projectos específicos com objectivos definidos, tais como tanques autónomos e sistemas de gestão de batalha.

Os principais laboratórios, incluindo o MIT, Stanford, CMU e Edimburgo, já tinham beneficiado de financiamento governamental substancial. A subsequente retirada deste apoio afetou desproporcionalmente estas instituições, tornando-as as principais entidades afetadas pelas reduções orçamentais. Por outro lado, milhares de investigadores que operam independentemente destas instituições, juntamente com novos participantes no campo, permaneceram praticamente inalterados.

Críticas Filosóficas e Éticas

Vários filósofos expressaram reservas significativas em relação às afirmações feitas pelos pesquisadores de IA. John Lucas, um dos primeiros críticos, afirmou que o teorema da incompletude de Gödel demonstrava a incapacidade de um sistema formal, como um programa de computador, de discernir a verdade de afirmações específicas, uma capacidade possuída pelos humanos. Hubert Dreyfus ridicularizou as promessas não cumpridas da década de 1960 e desafiou os pressupostos fundamentais da IA, postulando que o raciocínio humano envolve principalmente "know-how" incorporado, instintivo e inconsciente, em vez de "processamento de símbolos" extensivo. Em 1980, John Searle apresentou seu argumento da Sala Chinesa, com o objetivo de ilustrar que um programa não pode "compreender" genuinamente os símbolos que manipula (uma característica denominada "intencionalidade"). Searle sustentou que se os símbolos carecem de significado intrínseco para uma máquina, então a máquina não pode ser descrita com precisão como "pensante". Os pesquisadores de IA rejeitaram amplamente essas críticas filosóficas, priorizando desafios mais imediatos e tangíveis, como a intratabilidade e a aquisição de conhecimento de senso comum. As implicações práticas de conceitos como “know how” ou “intencionalidade” para programas de computador operacionais permaneceram ambíguas para eles. Marvin Minsky, do MIT, afirmou a famosa declaração de que Dreyfus e Searle "entendem mal e devem ser ignorados". Dreyfus, apesar de também ser membro do corpo docente do MIT, sofreu ostracismo social, comentando mais tarde que os pesquisadores de IA "não ousavam ser vistos almoçando comigo". Joseph Weizenbaum, criador do ELIZA, embora também crítico das posições de Dreyfus, condenou explicitamente a conduta de seus colegas de IA em relação a Dreyfus como pouco profissional e infantil, enfatizando que "não era a maneira de tratar um ser humano".

Weizenbaum desenvolveu profundas preocupações éticas em relação à IA depois que Kenneth Colby criou um “programa de computador que pode conduzir diálogo psicoterapêutico” derivado do ELIZA. Weizenbaum achou perturbador que Colby considerasse um programa não senciente um instrumento terapêutico viável. Este desacordo transformou-se numa rivalidade, exacerbada pela falha de Colby em reconhecer a contribuição fundamental de Weizenbaum para o programa. Em 1976, Weizenbaum publicou Computer Power and Human Reason, afirmando que a aplicação inadequada da inteligência artificial poderia diminuir o valor da existência humana.

Pesquisa de lógica em Stanford, CMU e Edimburgo

A integração da lógica na pesquisa em IA começou em 1958 com a proposta Advice Taker de John McCarthy. Em 1963, J. Alan Robinson desenvolveu um método simples para dedução baseada em computador, utilizando algoritmos de resolução e unificação. No entanto, as implementações diretas, como as empreendidas por McCarthy e os seus alunos no final da década de 1960, revelaram-se altamente intratáveis, exigindo um número exorbitante de passos computacionais para validar até mesmo teoremas básicos. Uma metodologia lógica mais eficaz surgiu na década de 1970, iniciada por Robert Kowalski, da Universidade de Edimburgo. Esta inovação logo fomentou uma colaboração com os pesquisadores franceses Alain Colmerauer e Philippe Roussel, resultando no desenvolvimento do Prolog, uma linguagem de programação lógica de sucesso. O Prolog emprega um subconjunto lógico específico, conhecido como cláusulas de Horn (intimamente relacionadas a "regras" e "regras de produção"), que facilita a computação tratável. O conceito de regras posteriormente permaneceu influente, formando a base para os sistemas especialistas de Edward Feigenbaum e informando a pesquisa em andamento de Allen Newell e Herbert A. Simon, que culminou em Soar e suas teorias unificadas de cognição.

Os críticos da abordagem lógica, ecoando as observações de Dreyfus, notaram que a resolução humana de problemas raramente dependia da lógica formal. Esta afirmação foi fundamentada por experimentos conduzidos por psicólogos como Peter Wason, Eleanor Rosch, Amos Tversky e Daniel Kahneman. McCarthy, no entanto, respondeu que os processos cognitivos humanos eram irrelevantes, argumentando que o objetivo era desenvolver máquinas capazes de resolver problemas, em vez de máquinas que meramente emulassem o pensamento humano.

Abordagem Antilógica do MIT

Entre os críticos da metodologia de McCarthy estavam seus colegas do MIT. Marvin Minsky, Seymour Papert e Roger Schank concentraram-se em problemas como “compreensão de histórias” e “reconhecimento de objetos”, que exigiam que as máquinas pensassem de maneira semelhante à humana. Para utilizar conceitos cotidianos como “cadeira” ou “restaurante”, esses pesquisadores tiveram que incorporar as mesmas suposições ilógicas comumente feitas pelas pessoas. Representar conceitos tão imprecisos dentro de uma estrutura lógica revelou-se um desafio. Consequentemente, o MIT optou por desenvolver programas que resolvessem tarefas específicas através de testes iterativos, evitando definições abstratas de alto nível ou teorias gerais da cognição e priorizando o desempenho prático em detrimento dos argumentos dos primeiros princípios. Schank caracterizou esses métodos "anti-lógicos" como "desalinhados", contrastando-os com o paradigma "puro" defendido por McCarthy, Kowalski, Feigenbaum, Newell e Simon.

Em um artigo seminal de 1975, Minsky observou que muitos de seus colegas estavam empregando uma ferramenta semelhante: uma estrutura projetada para capturar suposições de senso comum sobre uma determinada entidade. Por exemplo, o conceito de “pássaro” evoca imediatamente uma constelação de factos, tais como a suposição de que voa ou come minhocas, embora isto não seja universalmente verdadeiro para todas as aves. Minsky propôs que essas suposições estivessem associadas a uma categoria geral e poderiam ser herdadas por frames representando subcategorias e instâncias individuais, com a flexibilidade de serem substituídas conforme necessário. Ele denominou essas estruturas de frames. Schank posteriormente utilizou uma versão de frames, que ele chamou de "scripts", para responder com sucesso a perguntas sobre contos ingleses. Os frames eventualmente encontraram ampla aplicação na engenharia de software, onde ficaram conhecidos como programação orientada a objetos.

Os lógicos responderam a este desafio. Pat Hayes afirmou que "a maioria dos 'frames' é apenas uma nova sintaxe para partes da lógica de primeira ordem", mas reconheceu que "há um ou dois detalhes aparentemente menores que causam muitos problemas, especialmente os padrões". Ray Reiter admitiu que "as lógicas convencionais, como a lógica de primeira ordem, carecem do poder expressivo para representar adequadamente o conhecimento necessário para o raciocínio por padrão". Ele propôs aumentar a lógica de primeira ordem com uma suposição de mundo fechado, que postula que uma conclusão é válida por padrão se o seu contrário não puder ser demonstrado. Reiter ilustrou como esta suposição corresponde ao raciocínio de bom senso empregado com frames e identificou seu "equivalente processual" na negação de Prolog como um fracasso. Ele esclareceu ainda que a suposição de mundo fechado, conforme ele a formulou, "não é uma noção de primeira ordem. (É uma meta noção.)". No entanto, Keith Clark demonstrou mais tarde que a negação como fracasso finito poderia ser entendida como raciocínio implícito com definições na lógica de primeira ordem, incorporando uma suposição de nome único onde termos distintos se referem a indivíduos distintos.

Ao longo do final dos anos 1970 e 1980, uma variedade de lógicas e extensões da lógica de primeira ordem foram desenvolvidas para abordar tanto a negação quanto a falha na programação lógica e o raciocínio padrão de forma mais ampla. Coletivamente, esses diversos sistemas lógicos são conhecidos como lógicas não monotônicas.

O Boom (1980–1987)

Durante a década de 1980, os "sistemas especialistas", um tipo específico de programa de inteligência artificial, ganharam ampla adoção pelas empresas em todo o mundo, mudando o foco principal da pesquisa convencional em IA para a representação do conhecimento. Os governos forneceram financiamento substancial, exemplificado por iniciativas como o Projeto de Computador de Quinta Geração do Japão e a Iniciativa de Computação Estratégica dos EUA. Consequentemente, a indústria da IA registou um crescimento significativo, passando “de alguns milhões de dólares em 1980 para milhares de milhões de dólares em 1988”.

Adoção generalizada de sistemas especialistas

Um sistema especialista é definido como um programa computacional projetado para responder a dúvidas ou resolver problemas dentro de um domínio de conhecimento especializado, empregando regras lógicas derivadas do conhecimento especializado. Exemplos pioneiros foram desenvolvidos por Edward Feigenbaum e seus alunos. O Dendral, iniciado em 1965, foi capaz de identificar compostos químicos a partir de leituras de espectrômetros, enquanto o MYCIN, desenvolvido em 1972, diagnosticou doenças infecciosas do sangue. Esses primeiros sistemas demonstraram efetivamente a viabilidade da abordagem do sistema especialista.

Os sistemas especialistas foram confinados a domínios restritos de conhecimento especializado, contornando assim o desafio do conhecimento do senso comum. A sua arquitectura simples facilitou o desenvolvimento e a subsequente modificação dos programas, uma vez implementados. Em última análise, estes sistemas demonstraram utilidade prática, uma conquista significativa que a inteligência artificial não tinha alcançado anteriormente.

Em 1980, a Carnegie Mellon University (CMU) desenvolveu um sistema especialista denominado R1 para a Digital Equipment Corporation. Este sistema alcançou um sucesso notável, gerando poupanças anuais de 40 milhões de dólares para a empresa em 1986. Consequentemente, as empresas globais iniciaram o desenvolvimento e implementação de sistemas especializados, levando a despesas superiores a mil milhões de dólares em IA em 1985, principalmente nos departamentos internos de IA. Surgiu uma indústria de apoio, abrangendo fabricantes de hardware como a Symbolics e a Lisp Machines, além de fornecedores de software como a IntelliCorp e a Aion.

Financiamento governamental aprimorado

Em 1981, o Ministério Japonês do Comércio Internacional e da Indústria alocou US$ 850 milhões para o Projeto de Computadores de Quinta Geração. Os objetivos do projeto incluíam o desenvolvimento de programas e a construção de máquinas capazes de conversar, traduzir línguas, interpretar imagens e realizar raciocínios semelhantes aos humanos. Notavelmente, e para consternação de alguns pesquisadores, o Prolog foi inicialmente selecionado como a principal linguagem de programação para esta iniciativa.

Outras nações iniciaram os seus próprios programas de investigação em resposta. O Reino Unido lançou o projeto Alvey de £ 350 milhões. Ao mesmo tempo, um consórcio de empresas americanas criou a Microelectronics and Computer Technology Corporation (MCC) para financiar extensos projetos em inteligência artificial e tecnologia da informação. A DARPA também reagiu criando a Iniciativa de Computação Estratégica, que resultou num aumento de três vezes no seu investimento em IA entre 1984 e 1988.

A Revolução do Conhecimento

A eficácia dos sistemas especialistas resultou do seu conhecimento especializado incorporado. Isto representou uma nova trajetória na pesquisa em IA que ganhou destaque ao longo da década de 1970. Como observou Pamela McCorduck, "os pesquisadores de IA estavam começando a suspeitar - com relutância, pois violava o cânone científico da parcimônia - que a inteligência poderia muito bem ser baseada na capacidade de usar grandes quantidades de conhecimentos diversos de maneiras diferentes". Ela observou ainda que "a grande lição da década de 1970 foi que o comportamento inteligente dependia muito de lidar com o conhecimento, às vezes um conhecimento bastante detalhado, de um domínio onde estava uma determinada tarefa". Consequentemente, os sistemas baseados no conhecimento e a engenharia do conhecimento emergiram como áreas significativas de investigação em IA na década de 1980. A expectativa era que bancos de dados extensos resolvessem o problema do conhecimento do senso comum e fornecessem o suporte necessário para o raciocínio do senso comum.

Durante a década de 1980, certos pesquisadores abordaram diretamente o problema do conhecimento do senso comum, construindo bancos de dados extensos destinados a abranger os fatos cotidianos conhecidos por um indivíduo médio. Douglas Lenat, que iniciou um projeto de banco de dados chamado Cyc, afirmou que não existiam atalhos; o único método para as máquinas compreenderem os conceitos humanos era por meio de instruções manuais, conceito por conceito.

Rumos emergentes na década de 1980

Apesar do desenvolvimento de aplicações práticas e do financiamento substancial para a representação simbólica do conhecimento e do raciocínio lógico durante a década de 1980, estes métodos revelaram-se insuficientes para resolver desafios de percepção, robótica, aprendizagem e bom senso. Consequentemente, uma minoria de cientistas e engenheiros questionou a adequação a longo prazo do paradigma simbólico para estas tarefas, levando ao desenvolvimento de metodologias alternativas como o "conexionismo", a computação "suave" e a aprendizagem por reforço. Nils Nilsson categorizou essas novas abordagens como “subsimbólicas”.

O ressurgimento das redes neurais: "Conexionismo"

Em 1982, o físico John Hopfield demonstrou que um tipo específico de rede neural, agora conhecida como "rede Hopfield", possuía a capacidade de aprender e processar informações, exibindo convergência dentro de um período de tempo suficiente sob qualquer condição fixa. Isto representou um avanço significativo, uma vez que suposições anteriores sugeriam que as redes não lineares geralmente exibiriam uma evolução caótica. Geoffrey Hinton posteriormente estabeleceu uma descoberta comparável a respeito de um dispositivo denominado "máquina Boltzmann". (Hopfield e Hinton receberam mais tarde o Prêmio Nobel de 2024 por suas contribuições.) Além disso, em 1986, Hinton e David Rumelhart divulgaram amplamente a "retropropagação", um método para treinar redes neurais. Esses três desenvolvimentos fundamentais estimularam coletivamente um interesse renovado na investigação de redes neurais artificiais.

As redes neurais, juntamente com vários modelos análogos, ganharam destaque significativo após a publicação em 1986 do Processamento Distribuído Paralelo, uma compilação de artigos em dois volumes editados por Rumelhart e pelo psicólogo James McClelland. O campo emergente foi denominado “conexionismo”, desencadeando um discurso intelectual substancial entre os proponentes da IA ​​simbólica e os “conexionistas”. Hinton caracterizou os símbolos como o “éter luminoso da IA”, implicando um paradigma de inteligência impraticável e enganoso. Esta afirmação constituiu um desafio direto aos princípios fundamentais que inspiraram a revolução cognitiva.

As redes neurais começaram a melhorar significativamente as capacidades em domínios especializados, como a previsão da estrutura de proteínas. Com base nas contribuições seminais de Terry Sejnowski, perceptrons multicamadas em cascata, incluindo PhD e PsiPred, alcançaram níveis de precisão que se aproximam dos máximos teóricos na previsão da estrutura secundária.

Em 1990, Yann LeCun, do Bell Labs, empregou redes neurais convolucionais para o reconhecimento de dígitos manuscritos. Este sistema foi amplamente implantado ao longo da década de 1990, processando códigos postais e instrumentos financeiros pessoais. Isso marcou a aplicação inicial comprovadamente prática das redes neurais.

Robótica e razão incorporada

Rodney Brooks, Hans Moravec e outros investigadores postularam que a inteligência genuína numa máquina necessita de incorporação – requer a capacidade de perceber, locomover-se, sustentar-se e interagir com o seu ambiente. As habilidades sensório-motoras são fundamentais para habilidades cognitivas avançadas, como o raciocínio de bom senso. Estas competências não podem ser efetivamente realizadas através do raciocínio simbólico abstrato; consequentemente, a inteligência artificial deve enfrentar desafios relacionados com a percepção, mobilidade, manipulação e sobrevivência sem recorrer à representação simbólica. Esses pesquisadores de robótica defenderam uma abordagem "de baixo para cima" para a construção da inteligência.

Esse conceito foi prenunciado por David Marr, que chegou ao MIT no final da década de 1970, vindo de uma carreira distinta em neurociência teórica, para chefiar o grupo de pesquisa dedicado aos estudos da visão. Ele rejeitou todas as metodologias simbólicas (tanto a lógica de McCarthy quanto os enquadramentos de Minsky), argumentando que a inteligência artificial exigia uma compreensão dos mecanismos físicos subjacentes da visão, começando a partir de princípios fundamentais, antes do envolvimento de qualquer processamento simbólico. (A trajetória de pesquisa de Marr foi tragicamente interrompida pela leucemia em 1980.) Em seu artigo de 1990 "Elefantes não jogam xadrez", o pesquisador de robótica Brooks desafiou diretamente a hipótese do sistema de símbolos físicos, argumentando que os símbolos não são invariavelmente necessários, visto que "o mundo é seu melhor modelo. Ele está sempre exatamente atualizado. Ele sempre tem todos os detalhes que precisam ser conhecidos. O truque é senti-los de maneira adequada e com bastante frequência."

Durante as décadas de 1980 e 1990, vários cientistas cognitivos também contestaram o paradigma de processamento de símbolos da cognição e afirmaram o papel indispensável do corpo físico nos processos cognitivos, uma estrutura teórica conhecida como a "tese da mente incorporada".

Soft computing e raciocínio probabilístico

A soft computing emprega metodologias capazes de operar com dados incompletos e imprecisos. Esses métodos não visam produzir soluções exatas e logicamente definitivas, mas sim fornecer resultados probabilisticamente precisos. Isto permitiu a resolução de desafios intratáveis ​​para abordagens simbólicas precisas. Relatos da mídia afirmavam frequentemente que esses instrumentos possuíam capacidades cognitivas semelhantes às humanas.

O Raciocínio Probabilístico em Sistemas Inteligentes: Redes de Inferência Plausível de Judea Pearl, uma influente publicação de 1988, integrou a teoria da probabilidade e da decisão no campo da inteligência artificial. A lógica difusa, iniciada por Lofti Zadeh durante a década de 1960, ganhou crescente adoção em aplicações de IA e robótica. A computação evolutiva e as redes neurais artificiais também processam informações imprecisas e são categorizadas como métodos de computação "soft". Ao longo da década de 1990 e início de 2000, inúmeras metodologias adicionais de soft computing foram concebidas e implementadas, incluindo redes bayesianas, modelos ocultos de Markov, teoria da informação e modelagem estocástica. Esses instrumentos, por sua vez, dependiam de técnicas matemáticas sofisticadas, como a otimização clássica. Durante a década de 1990 e início de 2000, esses paradigmas de computação leve constituíram o foco de um subcampo especializado da IA conhecido como “inteligência computacional”.

Aprendizado por reforço

A aprendizagem por reforço fornece reforço positivo a um agente após a execução bem-sucedida de uma ação desejada e pode administrar reforço negativo (ou "punições") em casos de desempenho abaixo do ideal. Este conceito foi delineado durante a primeira metade do século XX por psicólogos que empregaram modelos animais, como Thorndike, Pavlov e Skinner. Na década de 1950, Alan Turing e Arthur Samuel anteciparam a importância da aprendizagem por reforço na inteligência artificial.

A partir de 1972, Richard Sutton e Andrew Barto lideraram um programa de pesquisa altamente bem-sucedido e influente. Seus esforços colaborativos transformaram profundamente o estudo da aprendizagem por reforço e da tomada de decisões ao longo das quatro décadas subsequentes. Em 1988, Sutton conceituou o aprendizado de máquina dentro da estrutura da teoria da decisão, especificamente do processo de decisão de Markov. Esta formulação forneceu à disciplina uma base teórica robusta e facilitou o acesso a uma extensa gama de descobertas teóricas previamente estabelecidas na pesquisa operacional. Ao mesmo tempo, em 1988, Sutton e Barto desenvolveram o algoritmo de aprendizagem de "diferença temporal" (TD), que recompensa um agente exclusivamente quando suas previsões demonstram melhoria. Este algoritmo superou substancialmente o desempenho dos métodos anteriores. Em 1992, Gerald Tesauro implementou o aprendizado de TD no programa TD-Gammon, que alcançou proficiência de nível humano em gamão. Notavelmente, o programa adquiriu domínio do jogo através do jogo autônomo, sem qualquer conhecimento inicial. Um exemplo convincente de sinergia interdisciplinar surgiu em 1997, quando neurologistas identificaram que o sistema de recompensa de dopamina do cérebro também emprega uma variante do algoritmo de aprendizagem TD. A aprendizagem TD posteriormente alcançou influência significativa no século 21, sendo aplicada principalmente no AlphaGo e no AlphaZero.

O Segundo Inverno de IA (1990)

Durante a década de 1980, o entusiasmo do sector empresarial pela inteligência artificial seguiu a trajectória característica de uma bolha económica, experimentando uma rápida ascensão seguida de um declínio vertiginoso. O subsequente fracasso de inúmeras empresas fomentou uma percepção generalizada na esfera comercial de que a tecnologia carecia de viabilidade. Este dano à reputação da IA ​​persistiu no século XXI. No domínio académico, faltava consenso relativamente às causas precisas da incapacidade da IA ​​para concretizar a aspiração da inteligência a nível humano, uma visão que cativou a imaginação global na década de 1960. Coletivamente, esses elementos contribuíram para a fragmentação da IA ​​em subcampos díspares e concorrentes, cada um concentrado em problemas ou metodologias específicas, adotando ocasionalmente nova nomenclatura para obscurecer a reputação comprometida associada à "inteligência artificial".

Ao longo das duas décadas subsequentes, a IA forneceu consistentemente soluções funcionais para problemas distintos e circunscritos. No final da década de 1990, as suas aplicações eram generalizadas em toda a indústria tecnológica, embora muitas vezes funcionassem sem visibilidade pública proeminente. Este sucesso pode ser atribuído a vários fatores: aumento do poder computacional, colaborações sinérgicas com outras disciplinas (incluindo otimização matemática e estatística) e a adoção de padrões mais rigorosos de responsabilidade científica.

AI Inverno

A designação "Inverno da IA" originou-se entre investigadores que sofreram as reduções de financiamento de 1974, motivados pela sua apreensão de que o entusiasmo crescente pelos sistemas especialistas se tinha tornado excessivo, levando inevitavelmente à desilusão subsequente. Suas preocupações provaram ser prescientes: durante o final da década de 1980 e início da década de 1990, a inteligência artificial encontrou uma sucessão de reversões financeiras.

O prenúncio inicial dessa mudança foi o colapso abrupto do mercado especializado de hardware de IA em 1987. Os computadores desktop fabricados pela Apple e pela IBM aumentaram progressivamente em velocidade e potência de processamento, ultrapassando as capacidades das máquinas Lisp mais caras produzidas pela Symbolics e outros fabricantes em 1987. Conseqüentemente, a justificativa para a compra dedicada O hardware de IA diminuiu significativamente. Este evento levou ao colapso instantâneo de uma indústria avaliada em meio bilhão de dólares.

Em última análise, os sistemas especialistas pioneiros e bem-sucedidos, incluindo o R1, demonstraram custos de manutenção proibitivos. Esses sistemas apresentavam desafios de atualização, careciam de capacidade de aprendizagem e exibiam “fragilidade”, o que significa que eram propensos a erros significativos quando apresentados com entradas atípicas. Embora os sistemas especialistas oferecessem utilidade, a sua aplicabilidade estava restrita a um número limitado de contextos especializados.

Durante o final da década de 1980, a Iniciativa de Computação Estratégica reduziu drasticamente o financiamento para IA. A nova liderança dentro da DARPA concluiu que a IA não representava o futuro paradigma tecnológico e, consequentemente, realocou recursos para projetos considerados com maior probabilidade de produzir resultados imediatos.

Em 1991, os objetivos ambiciosos delineados em 1981 para o Projeto de Quinta Geração do Japão continuavam por cumprir. Certos objectivos, tais como a capacidade de “manter uma conversa casual”, não seriam alcançados durante mais três décadas. Consistente com outros esforços de IA, as expectativas iniciais excederam consideravelmente as capacidades reais.

No final de 1993, mais de 300 empresas de IA tinham cessado as operações, declarado falência ou sofrido aquisições, concluindo assim a fase comercial inicial da IA. Em 1994, HP Newquist postulou em The Brain Makers que "O futuro imediato da inteligência artificial - em sua forma comercial - parece depender em parte do sucesso contínuo das redes neurais."

IA nos bastidores

Algoritmos inicialmente desenvolvidos por pesquisadores de inteligência artificial (IA) foram integrados em sistemas mais amplos durante a década de 1990. A IA abordou com sucesso numerosos desafios complexos, produzindo soluções que se revelaram valiosas em todo o setor tecnológico, incluindo aplicações em mineração de dados, robótica industrial, logística, reconhecimento de voz, software bancário, diagnóstico médico e motor de pesquisa do Google.

Apesar destes avanços, o campo da IA ​​recebeu um reconhecimento mínimo pelas suas contribuições ao longo da década de 1990 e início de 2000. Muitas inovações significativas em IA foram posteriormente reclassificadas como componentes padrão na ciência da computação. Nick Bostrom elucida esse fenômeno, afirmando: "Muita IA de ponta foi filtrada para aplicações gerais, muitas vezes sem ser chamada de IA, porque uma vez que algo se torna útil e comum o suficiente, não é mais rotulado como IA." Durante a década de 1990, vários pesquisadores de IA designaram intencionalmente seu trabalho com terminologia alternativa, como informática, sistemas baseados em conhecimento, "sistemas cognitivos" ou inteligência computacional. Esta prática foi parcialmente motivada pela percepção de que o seu domínio divergia fundamentalmente da IA ​​tradicional, mas também pela vantagem estratégica que estes novos rótulos ofereciam na garantia de financiamento. Na esfera comercial, os compromissos não cumpridos do “inverno da IA” continuaram a lançar uma sombra sobre a pesquisa em IA na década de 2000, conforme documentado pelo The New York Times em 2005: “Cientistas da computação e engenheiros de software evitaram o termo inteligência artificial por medo de serem vistos como sonhadores de olhos arregalados”.

Rigor matemático aprimorado, esforços colaborativos e foco especializado

Os pesquisadores de IA adotaram e desenvolveram cada vez mais ferramentas matemáticas avançadas, superando os níveis anteriores de integração. A maioria das trajetórias emergentes de pesquisa em IA basearam-se substancialmente em modelos matemáticos, abrangendo redes neurais artificiais, raciocínio probabilístico, computação suave e aprendizagem por reforço. Ao longo das décadas de 1990 e 2000, inúmeras outras metodologias matemáticas sofisticadas foram adaptadas para aplicações de IA, particularmente nos domínios da aprendizagem automática, percepção e mobilidade.

Surgiu um amplo consenso relativamente à sobreposição entre problemas que exigem soluções de IA e aqueles já sob investigação por investigadores em disciplinas como estatística, matemática, engenharia eléctrica, economia e investigação operacional. Este quadro matemático comum facilitou uma maior colaboração com campos mais estabelecidos e bem-sucedidos, levando à obtenção de resultados mensuráveis ​​e verificáveis, transformando assim a IA numa disciplina científica mais rigorosa. Um outro factor crítico que contribuiu para o sucesso da década de 1990 foi a concentração dos investigadores de IA em problemas específicos passíveis de soluções verificáveis, uma abordagem posteriormente caracterizada como IA estreita. Esta estratégia produziu ferramentas práticas para aplicação imediata, em vez de promover previsões futuras especulativas.

Agentes Inteligentes

O paradigma dos “agentes inteligentes” ganhou ampla aceitação ao longo da década de 1990. Embora investigadores anteriores tenham defendido metodologias modulares de "dividir e conquistar" na IA, a formulação contemporânea do agente inteligente materializou-se através da integração de conceitos da teoria da decisão e da economia na investigação da IA ​​por figuras como Judea Pearl, Allen Newell e Leslie P. Kaelbling. O paradigma do agente inteligente foi totalmente estabelecido a partir da síntese da definição econômica de um agente racional com o conceito da ciência da computação de um objeto ou módulo.

Um agente inteligente é conceituado como um sistema capaz de perceber seu ambiente e executar ações destinadas a otimizar sua probabilidade de sucesso. De acordo com esta definição, tanto os programas rudimentares que abordam problemas específicos como entidades complexas como seres humanos ou organizações humanas (por exemplo, empresas) qualificam-se como "agentes inteligentes". O paradigma do agente inteligente redefine a pesquisa em IA como “o estudo de agentes inteligentes”, representando uma generalização mais ampla das definições anteriores de IA. Esta estrutura vai além do estudo exclusivo da inteligência humana para abranger todas as formas de inteligência. Além disso, este paradigma capacitou os investigadores a investigar problemas isolados e a divergir em abordagens metodológicas, mantendo ao mesmo tempo a aspiração de que as suas contribuições individuais pudessem, em última instância, fundir-se numa arquitectura de agente capaz de alcançar inteligência geral.

Marcos e a Lei de Moore

Em 11 de maio de 1997, o Deep Blue alcançou um marco histórico ao se tornar o primeiro sistema de xadrez computadorizado a derrotar o atual campeão mundial de xadrez, Garry Kasparov. Posteriormente, em 2005, um robô desenvolvido na Universidade de Stanford completou com sucesso o Grande Desafio DARPA, percorrendo autonomamente 131 milhas através de uma paisagem desértica desconhecida. Dois anos depois, uma equipe da Carnegie Mellon University (CMU) garantiu a vitória no DARPA Urban Challenge, navegando 88 quilômetros por um ambiente urbano enquanto gerenciava habilmente os perigos do trânsito e cumpria as regulamentações de trânsito.

Essas conquistas resultaram principalmente da aplicação diligente de conhecimentos de engenharia e dos avanços substanciais na velocidade e capacidade do computador observados na década de 1990, e não de um novo paradigma revolucionário. Por exemplo, a velocidade computacional do Deep Blue ultrapassou a do Ferranti Mark 1, que Christopher Strachey programou para jogar xadrez em 1951, por um fator de 10 milhões. Este crescimento exponencial é quantificado pela Lei de Moore, que postula uma duplicação da velocidade do computador e da capacidade de memória aproximadamente a cada dois anos, mitigando assim progressivamente a restrição fundamental da “potência bruta do computador”.

A influência da inteligência artificial nas artes e na literatura

Experimentos de literatura eletrônica, incluindo The Impermanence Agent (1998–2002), e instalações de arte digital como Agent Ruby, integraram a inteligência artificial para "desnudar o preconceito que acompanha as formas de tecnologia que fingem objetividade" em suas expressões artísticas e literárias.

Big Data, aprendizagem profunda e inteligência artificial geral (2005–2017)

Durante as primeiras décadas do século XXI, a convergência de uma ampla disponibilidade de dados (denominada "big data"), sistemas de computação cada vez mais acessíveis e poderosos e metodologias sofisticadas de aprendizagem automática facilitaram aplicações bem-sucedidas em diversos setores económicos. Um desenvolvimento fundamental ocorreu por volta de 2012 com o advento do aprendizado profundo, que melhorou significativamente o desempenho do aprendizado de máquina em vários domínios, incluindo processamento de imagem e vídeo, análise de texto e reconhecimento de fala. Ao mesmo tempo, os investimentos em IA aumentaram com suas capacidades em expansão, levando a um valor de mercado superior a US$ 8 bilhões para produtos, hardware e software relacionados à IA em 2016. O New York Times subsequentemente caracterizou o crescente interesse em IA como um "frenesi". defendendo, em vez disso, uma busca mais focada na inteligência artificial geral (AGI). Em meados da década de 2010, inúmeras organizações, incluindo a OpenAI e a DeepMind do Google, foram estabelecidas com o objetivo explícito de promover a AGI. Ao mesmo tempo, as perspectivas emergentes sobre a superinteligência suscitaram preocupações quanto ao potencial da IA ​​como uma ameaça existencial. Consequentemente, os riscos e implicações imprevistas da tecnologia de IA evoluíram para um domínio significativo da investigação académica pós-2016.

O papel do Big Data e dos sistemas de computação avançados

A eficácia do aprendizado de máquina durante a década de 2000 dependia da acessibilidade a extensos dados de treinamento e de maiores velocidades computacionais. Russell e Norvig observaram que "a melhoria no desempenho obtida pelo aumento do tamanho do conjunto de dados em duas ou três ordens de grandeza supera qualquer melhoria que possa ser feita ajustando o algoritmo". Geoffrey Hinton elucidou ainda mais esse contexto histórico, observando que nas décadas de 1980 e 1990, "nossos conjuntos de dados rotulados eram milhares de vezes pequenos demais. [E] nossos computadores eram milhões de vezes lentos demais", uma limitação que foi superada em 2010.

Durante a década de 2000, os dados mais impactantes para aprendizado de máquina e IA originaram-se de conjuntos de dados meticulosamente selecionados e rotulados. Em 2007, pesquisadores da UMass Amherst introduziram "Labeled Faces in the Wild", uma coleção de imagens anotadas de rostos que se tornou um recurso fundamental para treinamento e avaliação de sistemas de reconhecimento facial durante décadas. Posteriormente, Fei-Fei Li liderou a criação do ImageNet, um banco de dados abrangente composto por três milhões de imagens anotadas por voluntários por meio do Amazon Mechanical Turk. Lançado em 2009, o ImageNet serviu tanto como um valioso corpus de treinamento quanto como uma referência crítica para as gerações subsequentes de sistemas de processamento de imagens. Em 2013, o Google lançou o word2vec como uma ferramenta de código aberto, que aproveitou extensos dados de texto extraídos da Internet e técnicas de incorporação de palavras para gerar vetores numéricos que representam palavras individuais. A capacidade do word2vec de capturar com precisão relações semânticas, exemplificadas por adições vetoriais produzindo equivalências como "China + Rio = Yangtze" ou "Londres - Inglaterra + França = Paris", atraiu atenção considerável. Este banco de dados específico provou ser indispensável para o avanço de grandes modelos de linguagem no final da década de 2010.

A proliferação exponencial da Internet concedeu aos programas de aprendizado de máquina acesso sem precedentes a bilhões de páginas de texto e imagens adequadas para extração de dados. Ao mesmo tempo, desafios específicos foram abordados por dados pertinentes residentes em extensas bases de dados privadas. O McKinsey Global Institute informou que “em 2009, quase todos os setores da economia dos EUA tinham pelo menos uma média de 200 terabytes de dados armazenados”. Esse vasto acúmulo de informações foi denominado big data durante a década de 2000.

Em fevereiro de 2011, o sistema de resposta a perguntas da IBM, Watson, alcançou uma vitória notável sobre os dois principais campeões do Jeopardy!, Brad Rutter e Ken Jennings, durante uma partida de exibição do programa. A experiência sofisticada do Watson dependia fundamentalmente dos vastos recursos de informação disponíveis na Internet.

Aprendizado profundo

Em 2012, o AlexNet, um modelo de aprendizagem profunda criado por Alex Krizhevsky, alcançou o primeiro lugar no ImageNet Large Scale Visual Recognition Challenge, demonstrando um desempenho significativamente superior com menos erros do que o segundo colocado. O trabalho de Krizhevsky foi conduzido em colaboração com Geoffrey Hinton da Universidade de Toronto. Este evento representou um momento crítico no aprendizado de máquina, já que inúmeras outras abordagens de reconhecimento de imagem foram posteriormente substituídas pelo aprendizado profundo nos anos seguintes.

O aprendizado profundo utiliza fundamentalmente um perceptron multicamadas. Embora este projeto arquitetônico tenha sido reconhecido desde a década de 1960, sua aplicação prática exige um poder computacional substancial e extensos dados de treinamento. Antes que esses pré-requisitos fossem atendidos, melhorar o desempenho dos sistemas de processamento de imagens exigia a laboriosa criação de recursos ad hoc feitos à mão, que eram inerentemente complexos de implementar. A aprendizagem profunda, por outro lado, apresentou uma metodologia mais simples e generalizada.

Nos anos seguintes, a aprendizagem profunda foi aplicada com sucesso a uma ampla gama de problemas, abrangendo domínios como reconhecimento de fala, tradução automática, diagnóstico médico e jogos. Em cada aplicação, ele produziu consistentemente melhorias substanciais de desempenho. Este sucesso catalisou um aumento significativo no investimento e no interesse na inteligência artificial.

O problema de alinhamento

Na década de 2000, discussões renovadas sobre o futuro da inteligência artificial ganharam destaque, com vários livros populares examinando o potencial das máquinas superinteligentes e as suas implicações sociais. Embora algumas perspectivas, como The Singularity is Near, de Ray Kurzweil, fossem optimistas, outras, incluindo as de Nick Bostrom e Eliezer Yudkowsky, alertaram que uma IA suficientemente poderosa poderia representar uma ameaça existencial para a humanidade. Este tópico recebeu posteriormente ampla atenção da mídia, atraindo comentários de numerosos intelectuais e políticos importantes.

Os programas de inteligência artificial no século XXI são fundamentalmente definidos pelos seus objetivos, que são as medidas específicas que foram concebidos para otimizar. O influente livro de Nick Bostrom de 2014, Superinteligência, argumentou que o cuidado insuficiente na definição destes objectivos poderia resultar em máquinas causando danos à humanidade durante a sua prossecução de um objectivo. Stuart J. Russell deu um exemplo ilustrativo de um robô inteligente que elimina seu dono para evitar ser desconectado, racionalizando: “você não pode buscar o café se estiver morto”. Esta questão específica é tecnicamente denominada “convergência instrumental”. A solução proposta envolve alinhar a função objetivo da máquina com os objetivos de seu proprietário e da humanidade em geral. Portanto, o desafio de mitigar os riscos e as consequências não intencionais da IA ​​tornou-se formalmente conhecido como “o problema do alinhamento de valor” ou alinhamento da IA.

Simultaneamente, os sistemas de aprendizagem automática começaram a apresentar consequências não intencionais preocupantes. Cathy O'Neil detalhou como os algoritmos estatísticos contribuíram para a crise econômica de 2008. Julia Angwin, da ProPublica, afirmou que o sistema COMPAS, utilizado pelo sistema de justiça criminal, apresentava preconceito racial sob avaliações específicas. Além disso, outros estudos indicaram que muitos sistemas de aprendizagem automática manifestavam várias formas de preconceito racial, e foram documentados numerosos exemplos adicionais de resultados perigosos decorrentes destes sistemas.

Em 2016, a eleição de Donald Trump e a controvérsia em torno do sistema COMPAS destacaram várias deficiências críticas na infra-estrutura tecnológica contemporânea, incluindo a propagação de desinformação, algoritmos de redes sociais concebidos para maximizar o envolvimento, a utilização indevida de dados pessoais e questões relativas à fiabilidade dos modelos preditivos. Consequentemente, as questões de justiça e consequências não intencionais ganharam força considerável nas conferências sobre IA, levando a um aumento substancial de publicações, à atribuição de financiamento dedicado e a uma reorientação do foco profissional de numerosos investigadores para estas preocupações. O problema do alinhamento de valores emergiu posteriormente como um campo sério de estudo acadêmico.

Pesquisa de Inteligência Geral Artificial

No início dos anos 2000, surgiu uma preocupação crescente entre os pesquisadores de que a inteligência artificial (IA) convencional havia se tornado excessivamente concentrada no "desempenho mensurável em aplicações específicas", um domínio frequentemente denominado "IA restrita". Este foco foi percebido como um afastamento do objetivo fundamental da IA: o desenvolvimento de máquinas versáteis e abrangentemente inteligentes. Nils Nilsson expressou as primeiras críticas em 1995, com figuras proeminentes da IA, como John McCarthy, Marvin Minsky e Patrick Winston, publicando perspectivas análogas entre 2007 e 2009. Minsky contribuiu ainda mais organizando um simpósio sobre "IA de nível humano" em 2004. Posteriormente, Ben Goertzel cunhou o termo "inteligência artificial geral" (AGI) para este subcampo nascente, estabelecendo um jornal dedicado e iniciando conferências a partir de 2008. O campo da AGI experimentou uma rápida expansão, impulsionada pelos avanços sustentados nas redes neurais artificiais e pela antecipação de que esses desenvolvimentos seriam a chave para alcançar a AGI.

A década de 2010 testemunhou o estabelecimento de inúmeras entidades concorrentes, incluindo empresas, laboratórios e fundações, todas dedicadas ao avanço da inteligência artificial geral (AGI). A DeepMind, por exemplo, foi cofundada em 2010 por três cientistas britânicos – Demis Hassabis, Shane Legg e Mustafa Suleyman – inicialmente recebendo capital de Peter Thiel, com investimento subsequente de Elon Musk. Tanto os fundadores como os seus financiadores expressaram profunda apreensão em relação à segurança da IA ​​e aos potenciais riscos existenciais colocados pela IA avançada. Os fundadores da DeepMind mantiveram uma associação direta com Yudkowsky, e Musk foi uma figura notável que vocalizou ativamente essas preocupações. Hassabis articulou uma perspectiva dupla, expressando tanto ansiedade sobre os perigos inerentes da AGI quanto otimismo em relação ao seu potencial transformador, aspirando a "resolver a IA e depois resolver todo o resto". Em 2023, o The New York Times observou: "No centro deste cenário competitivo está um profundo paradoxo: os indivíduos que expressam a maior preocupação com a IA estão simultaneamente entre os mais resolutos na sua criação e na procura das suas recompensas financeiras. Eles racionalizam as suas atividades ambiciosas com a firme convicção de que só eles possuem a capacidade de proteger a Terra dos perigos potenciais da IA." desde a década de 1980, recebeu uma oferta do Baidu para recrutá-lo e a toda a sua equipe de pesquisa por uma quantia financeira substancial. Posteriormente, Hinton organizou um leilão, culminando na venda da experiência de sua equipe ao Google por US$ 44 milhões durante uma conferência de IA realizada em Lake Tahoe. Observando esse desenvolvimento, Hassabis vendeu a DeepMind para o Google em 2014, estipulando que a empresa se absteria de aceitar contratos militares e operaria sob a supervisão de um conselho de ética independente.

Larry Page, cofundador do Google, tinha uma visão otimista em relação ao futuro da IA, contrastando com as perspectivas mais cautelosas de Musk e Hassabis. Um desacordo significativo sobre os riscos da AGI eclodiu entre Musk e Page na celebração do aniversário de Musk em 2015. Apesar de uma amizade de décadas, a comunicação entre eles cessou pouco depois. Musk participou da única reunião do conselho de ética da DeepMind, onde ficou evidente que o Google demonstrou pouco interesse em mitigar ativamente os danos potenciais da AGI. Insatisfeito com a sua influência limitada, Musk criou a OpenAI em 2015, nomeando Sam Altman como seu líder e recrutando cientistas de renome. Inicialmente estruturada como uma organização sem fins lucrativos, a OpenAI pretendia operar “livre dos incentivos económicos que impulsionavam o Google e outras corporações”. A renovada frustração de Musk levou à sua saída da empresa em 2018. Posteriormente, a OpenAI buscou apoio financeiro sustentado da Microsoft, e Altman, em colaboração com a OpenAI, reestruturou a entidade em um empreendimento com fins lucrativos, garantindo mais de US$ 1 bilhão em financiamento. Posteriormente, eles estabeleceram a Anthropic, que rapidamente garantiu US$ 6 bilhões em financiamento da Microsoft e do Google.

Grandes modelos de linguagem e o boom da IA (2017–presente)

O aumento contemporâneo da inteligência artificial, muitas vezes denominado "boom da IA", começou com o desenvolvimento fundamental de arquiteturas e algoritmos essenciais, nomeadamente a arquitetura do transformador em 2017. Esta inovação facilitou o amplo dimensionamento e a subsequente criação de grandes modelos de linguagem (LLMs) que demonstram atributos semelhantes aos humanos na aquisição de conhecimento, processamento de atenção e geração criativa. Uma nova época na IA foi inaugurada em 2020, marcada pela introdução pública do GPT-3, um modelo de linguagem de grande escala significativamente dimensionado e o precursor do ChatGPT.

Arquitetura de transformadores e grandes modelos de linguagem

Em 2017, pesquisadores do Google apresentaram a arquitetura do transformador em um artigo intitulado "Atenção é tudo que você precisa". Essa arquitetura aproveita um mecanismo de autoatenção e posteriormente ganhou ampla adoção em grandes modelos de linguagem. Grandes modelos de linguagem, construídos sobre o transformador, foram avançados por outras organizações: a OpenAI lançou o GPT-3 em 2020, seguido pelo lançamento do Gato pela DeepMind em 2022. Estes constituem modelos básicos, treinados em grandes quantidades de dados não rotulados e adaptáveis ​​a uma gama diversificada de tarefas downstream. Esses modelos demonstram a capacidade de discutir uma vasta gama de assuntos e exibir conhecimento geral, o que gerou questionamentos sobre sua classificação potencial como instâncias de inteligência artificial geral.

Em 2023, a Microsoft Research avaliou o modelo em inúmeras tarefas, concluindo que "ele poderia razoavelmente ser visto como uma versão inicial (mas ainda incompleta) de um sistema de inteligência artificial geral (AGI)."

Em 2024, a OpenAI anunciou o OpenAI o3, um modelo de raciocínio avançado desenvolvido pela empresa. No benchmark Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI), criado por François Chollet em 2019, o modelo atingiu uma pontuação não oficial de 87,5% no teste semiprivado, superando assim o desempenho humano típico de 84%. Este parâmetro de referência é considerado um critério necessário, embora não suficiente, para a AGI. Em relação ao benchmark, Chollet afirmou: "Você saberá que a AGI está aqui quando o exercício de criar tarefas que são fáceis para humanos normais, mas difíceis para a IA, se tornar simplesmente impossível."

Investimento em IA

O investimento em inteligência artificial registou um crescimento exponencial após 2020, com o financiamento de capital de risco para empresas de IA generativa a aumentar significativamente. Os investimentos totais em IA aumentaram de 18 mil milhões de dólares em 2014 para 119 mil milhões de dólares em 2021, com a IA generativa a constituir aproximadamente 30% do total de investimentos até 2023. De acordo com métricas de 2017 a 2021, os Estados Unidos ultrapassaram outras nações a nível mundial em termos de financiamento de capital de risco, número de startups e patentes de IA concedidas. O cenário comercial da IA ​​foi predominantemente moldado pelas grandes empresas americanas de tecnologia, cujos investimentos neste setor ultrapassaram os provenientes de capitalistas de risco sediados nos EUA. A avaliação da OpenAI atingiu US$ 86 bilhões no início de 2024, enquanto a capitalização de mercado da NVIDIA ultrapassou US$ 3,3 trilhões em meados de 2024, posicionando-a como a maior empresa do mundo em capitalização de mercado, impulsionada por um aumento substancial na demanda por GPUs com capacidade de IA.

Adoção pública de IA

Lançado em março de 2020 por um pesquisador anônimo do MIT, o 15.ai representou um dos primeiros exemplos de IA generativa, atraindo interesse público significativo durante a fase inicial da expansão da IA. Este aplicativo da web gratuito demonstrou a capacidade de replicar vozes de personagens usando redes neurais com dados de treinamento mínimos, necessitando de apenas 15 segundos de entrada de áudio para reprodução de voz – uma capacidade posteriormente validada pela OpenAI em 2024. O serviço alcançou viralidade generalizada em plataformas de mídia social no início de 2021, permitindo aos usuários sintetizar a fala de personagens de franquias de mídia populares, e foi particularmente distinguido por sua contribuição fundamental para a popularização da síntese de voz de IA para conteúdo criativo e memes.

O ChatGPT foi lançado em 30 de novembro de 2022, significando um momento crucial na adoção pública da inteligência artificial. Poucos dias após seu lançamento, ele alcançou uma rápida viralidade, acumulando mais de 100 milhões de usuários em dois meses e estabelecendo-se como o aplicativo de software de consumo com crescimento mais rápido na história. A capacidade do chatbot para interação conversacional semelhante à humana, geração de código e produção de conteúdo criativo cativou o interesse público e facilitou a rápida integração em diversos setores, incluindo educação, negócios e pesquisa. O sucesso do ChatGPT provocou reações incomparáveis das principais empresas de tecnologia: o Google emitiu um alerta de "código vermelho" e apresentou prontamente o Gemini (anteriormente conhecido como Google Bard), enquanto a Microsoft integrou a tecnologia ao Bing Chat.

A rápida adoção destas tecnologias de IA instigou um debate considerável sobre as suas implicações. Notáveis ​​investigadores de IA e líderes da indústria expressaram um espectro de perspectivas, abrangendo perspectivas optimistas e apreensões relativamente à rápida trajectória de desenvolvimento. Em março de 2023, mais de 20.000 signatários, incluindo o cientista da computação Yoshua Bengio, Elon Musk e o cofundador da Apple Steve Wozniak, assinaram uma carta aberta defendendo uma moratória sobre o desenvolvimento avançado de IA, destacando “riscos profundos para a sociedade e a humanidade”. Por outro lado, outros investigadores proeminentes, como Juergen Schmidhuber, adoptaram uma perspectiva mais otimista, postulando que o objectivo predominante da investigação em IA é aumentar a longevidade, o bem-estar e a conveniência humana.

Em meados de 2024, no entanto, o sector financeiro iniciou uma análise mais rigorosa das empresas de IA, questionando especificamente a sua capacidade de produzir retornos sobre o investimento proporcionais às suas substanciais avaliações de mercado. Alguns investidores proeminentes articularam apreensões relativamente a uma potencial divergência entre as expectativas do mercado e os fundamentos empresariais subjacentes. Jeremy Grantham, cofundador da GMO LLC, alertou os investidores para “terem muito cuidado” e identificou semelhanças com episódios especulativos de mercado anteriores alimentados pela tecnologia. Da mesma forma, Jeffrey Gundlach, CEO da DoubleLine Capital, comparou explicitamente o aumento da IA ​​à bolha pontocom do final da década de 1990, sugerindo que o fervor dos investidores poderia estar a exceder as capacidades tangíveis de curto prazo e as perspectivas de geração de receitas. As consideráveis ​​capitalizações de mercado de empresas centradas em IA, muitas das quais ainda não tinham estabelecido paradigmas de rentabilidade viáveis, exacerbaram ainda mais estas preocupações.

Em março de 2024, a Anthropic revelou o conjunto Claude 3 de grandes modelos de linguagem, abrangendo Claude 3 Haiku, Sonnet e Opus. Os modelos exibiram melhorias substanciais no desempenho em múltiplas métricas de avaliação, com Claude 3 Opus superando visivelmente modelos proeminentes da OpenAI e do Google. Em junho de 2024, a Anthropic lançou o Claude 3.5 Sonnet, que apresentou desempenho aprimorado em relação ao Claude 3 Opus mais extenso, especialmente em domínios como desenvolvimento de software, processos sequenciais complexos e interpretação de dados visuais.

Prêmios Nobel de 2024

Em 2024, a Real Academia Sueca de Ciências concedeu Prêmios Nobel em reconhecimento aos avanços seminais na inteligência artificial. Os laureados incluíram:

Avanços contínuos e pesquisas em IA

Em janeiro de 2025, a OpenAI revelou o ChatGPT-Gov, um novo sistema de IA projetado especificamente para implantação segura por agências governamentais dos EUA. A OpenAI indicou que as agências seriam capazes de implantar o ChatGPT-Gov em uma nuvem Microsoft Azure ou em uma nuvem Azure Government, aproveitando o “Serviço Azure OpenAI da Microsoft”. De acordo com a declaração oficial da OpenAI, "o ChatGPT Gov auto-hospedado permite que as agências gerenciem mais facilmente seus próprios requisitos de segurança, privacidade e conformidade, como estruturas rigorosas de segurança cibernética (IL5, CJIS, ITAR, FedRAMP High). Além disso, acreditamos que esta infraestrutura agilizará a autorização interna das ferramentas da OpenAI para o tratamento de dados confidenciais não públicos."

Políticas nacionais

Os países alocaram recursos para políticas e apoio financeiro para a implantação de sistemas robóticos autônomos, com o objetivo de mitigar os déficits trabalhistas e aumentar a eficiência operacional, estabelecendo simultaneamente quadros regulatórios para garantir práticas de desenvolvimento éticas e seguras.

China

Em 2025, a China destinou aproximadamente 730 mil milhões de yuans (equivalente a aproximadamente 100 mil milhões de dólares) para o avanço da IA e da robótica nos setores da produção inteligente e da saúde. O "14º Plano Quinquenal" (2021–2025) enfatizou a robótica de serviço, aproveitando os sistemas de IA para capacitar os robôs a executar funções complexas, incluindo assistência cirúrgica e montagem automatizada em fábrica. Uma parte deste financiamento também foi direcionada para aplicações de defesa, especificamente tecnologias de drones autônomos. A partir de setembro de 2025, a China instituiu um requisito para a rotulagem de conteúdos gerados por IA, com o objetivo de promover a transparência e a confiança do público nestes avanços tecnológicos.

Estados Unidos

Em janeiro de 2025, a Stargate LLC foi estabelecida como uma empresa colaborativa envolvendo OpenAI, SoftBank, Oracle e MGX, que posteriormente declarou intenções de investir US$ 500 bilhões em infraestrutura de inteligência artificial nos Estados Unidos até 2029. A iniciativa recebeu anúncio formal do presidente dos EUA, Donald Trump, em 21 de janeiro de 2025, simultaneamente com a nomeação do CEO do SoftBank, Masayoshi Son, como seu presidente.

O governo dos Estados Unidos comprometeu aproximadamente 2 mil milhões de dólares para a integração da inteligência artificial e da robótica nos setores de produção e logística. Os governos estaduais aumentaram este investimento federal fornecendo financiamento adicional para robôs de serviço, exemplificado pela sua implantação em armazéns para gestão de inventário através de comandos verbais, e em instalações de cuidados a idosos para responder aos pedidos de ajuda dos residentes. Uma parte destes fundos também foi alocada para aplicações de defesa, abrangendo armas letais autónomas e robótica militar. Além disso, em janeiro de 2025, a Ordem Executiva 14179 instituiu um “Plano de Ação de IA”, concebido para acelerar a inovação e implementação destas tecnologias, declarando explicitamente objetivos de “dominação mundial” e “vitória”.

Notas

Referências

Trabalhos citados

Sobre este artigo

O que é História da inteligência artificial?

Um breve guia sobre História da inteligência artificial, suas principais características, usos e temas relacionados.

Etiquetas de tema

O que é História da inteligência artificial História da inteligência artificial explicado Conceitos básicos de História da inteligência artificial Artigos de Tecnologia Tecnologia em curdo Temas relacionados

Buscas comuns sobre este tema

  • O que é História da inteligência artificial?
  • Para que serve História da inteligência artificial?
  • Por que História da inteligência artificial é importante?
  • Quais temas se relacionam com História da inteligência artificial?

Arquivo da categoria

Arquivo de Tecnologia

Explore o vasto universo da tecnologia com nossos artigos aprofundados. Desde os fundamentos da computação e redes como 5G e ARPANET, até as inovações em inteligência artificial como aprendizado de máquina e aprendizado

Início Voltar para Tecnologia