Programas de computador capazes de se comunicar com os usuários através da linguagem natural simulando o comportamento humano são pensados por obras ficcionais desce os primórdios da computação. Esses sistemas, hoje conhecidos como chatbots já vêm sendo desenvolvidos há algumas décadas, mas tiveram na computação móvel o meio pelo qual se popularizar e alcançar os mais diversos públicos e fazer parte do cotidiano dos usuários.
Mesmo com a recente popularização os chatbots ainda estão longe de serem tão inteligentes ou proverem qualidade de interação tão boa quanto a de seres humanos. Outro fator que pesa contra os chatbots é a dificuldade e o esforço empregados no desenvolvimento e na manutenção destes. Na tentativa de diminuir estes custos foram desenvolvidas várias plataformas, ferramentas e linguagens de modelagem de diálogos. Entretanto, as ferramentas atuais ainda oscilam entre a dificuldade de implementação, a impossibilidade de customização e utilização de softwares e infraestrutura de terceiros.
Uma das linguagens criadas para modelagem de diálogos que ganhou grande notoriedade por seus recursos e pelos bons resultados obtidos pelos chatbots nela criados é a ChatScript. Simples, expressiva, bem documentada e com suporte a recursos externos a ChatScript tem sido adotada para o desenvolvimento de muitos sistemas conversacionais nos últimos anos e é apresentada por alguns autores como a melhor linguagem para desenvolvimento de chatbots.
Este trabalho apresenta uma abordagem que visa reduzir os esforços necessários para o desenvolvimento de chatbots. Seu principal objetivo é propor uma abordagem para geração automatizada de chatbots escritos em ChatScript utilizando como entrada listas de perguntas e respostas escritas em linguagem natural. Para isso são utilizadas técnicas de Processamento de Linguagem Natural, Mineração de Dados e Aprendizagem de Máquina, tais como Part-of-Speech Tagging, Web Scraping, Web Crawling, Word Embedding e Redes Neurais Artificiais.