Visão Geral sobre Redes Neurais
A tecnologia de redes neurais mimetiza o processo de resolução de problemas do cérebro humano. Tal como humanos aplicam o conhecimento adquirido de experiências passadas para novos problemas ou situações, uma rede neural utiliza exemplos resolvidos previamente para construir um sistema de "neurônios" que toma novas decisões, faz classificações, e prognósticos.
Redes Neurais buscam por padrões em treinamento realizado em conjuntos de dados, aprendem estes padrões, e desenvolvem a habilidade de classificar corretamente ou fazer prognósticos e predições. A rede neural supera-se em diagnóstico de problemas, tomada de decisões, predição, e outros problemas de classificação onde o reconhecimento de padrões é importante e respostas computacionais precisas não são requeridas.
Há dois tipos básicos de rede neurais: supervisionadas e não supervisionadas:
Redes supervisionadas
Constróem modelos, os quais classificam padrões ou executam predições de acordo com outros padrões de "entradas" e "saídas" que eles aprenderam.
Eles dão a resposta mais razoável baseada em uma variedade de padrões de aprendizado. Em uma rede supervisionada, você mostra à rede como fazer predições, classificações, ou decisões, fornecendo a ela um grande número de classificações corretas ou predições das quais ela pode aprender. Redes de Retropropagação, GRNN ("General Regression Neural Networks"), PNN ("Probabilistic Neural Networks"), e GMDH ("Group Method Data Handling") são exemplos de redes supervisionadas.
Redes não supervisionadas
Podem classificar um conjunto de padrões de treinamento em um número especificado de categorias sem ser mostrado antes como categorizar. A rede faz isto agrupando os padrões. Ela agrupa-os por sua proximidade em um espaço dimensional N onde o N é o número de "entradas". O usuário diz à rede o número máximo de categorias e ela geralmente agrupa os dados em um certo número de categorias. Entretanto, ocasionalmente a rede pode não ser capaz de separar os padrões naquelas muitas categorias opcionais. Redes Kohonen são exemplos de redes não supervisionadas.
Nenhum tipo de rede é garantida de sempre dar uma resposta absolutamente "correta", especialmente se os padrões são de alguma forma incompletos ou conflitantes.
Os resultados devem ser avaliados em termos da percentagem de respostas corretas que resultaram do modelo.
A esse respeito, a tecnologia é similar ao funcionamento do neurônio biológico depois deste ter sido "projetado", e difere significantemente de todos outros programas convencionais de computador. Redes Neurais podem não trabalhar bem em algumas aplicações. Alguns problemas são bem apropriados para a capacidade de reconhecimento de padrões de uma rede neural e outros são melhor resolvidos com métodos tradicionais.
O bloco de construção básico da tecnologia de redes neurais é o neurônio simulado (descrito na figura como um círculo). Neurônios independentes são de pouco uso, a menos que eles estejam interconectados em uma rede de neurônios. A rede processa um número de entradas ("inputs") do "mundo externo" para produzir uma saída ("output"), que são as classificações da rede ou predições. Os neurônios são conectados por pesos (retratados como linhas), os quais são aplicados a valores passados de um neurônio para o outro.
Um grupo de neurônios é chamado de slab. Os neurônios também são agrupados em camadas por suas conexões com o "mundo externo". Por exemplo, se um neurônio recebe dados de fora da rede, ele é considerado como estando na camada de entrada. Se um neurônio contém as classificações ou predições da rede, ele está na camada de saída. Neurônios entre as camadas de entrada e saída estão na(s) camada(s) oculta(s). Uma camada pode conter uma ou mais slabs de neurônios.
Uma rede neural típica é uma Rede de Retropropagação, a qual geralmente tem 3 camadas de neurônios. Valores de entrada na primeira camada são pesados e passados para a segunda camada. Neurônios na camada oculta "atiram" ou produzem saídas que são baseadas na soma dos valores pesados passados por elas. A camada oculta passa valores à camada de saída da mesma forma, e a camada de saída produz os resultados desejados (predições ou classificações).
A rede "aprende", ajustando os pesos das interconexões entre as camadas. As respostas que a rede está produzindo são repetidamente comparadas com as respostas corretas, e cada vez os pesos das conexões são ajustados na direção das respostas corretas.
Eventualmente, se o problema pode ser aprendido, um conjunto estável de pesos adaptativamente evolui e irá produzir boas respostas para todas as decisões ou predições da amostra. O real poder das redes neurais é evidente quando a rede treinada é capaz de produzir bons resultados para dados os quais ela nunca "viu" antes.
O maior segredo para construir com sucesso redes neurais é saber quando parar de treinar. Se você treina muito pouco, a rede não irá aprender os padrões. Se você treinar muito, a rede irá aprender com o problema ou memorizar os padrões de treinamento e não generalizar bem com novos padrões.
Outras utilizações atualmente empregando as Redes Neurais Artificiais: diagnóstico de doenças, identificação de compostos químicos, análise de testes médicos, controle de processo, predição de horas de trabalho necessárias para procedimentos industriais, identificação bacteriana, análise de custos, diagnóstico diferencial, otimizando resultados de experimentos biológicos, análise nutricional, experimentos agrícolas, gerenciamentos de recursos hídricos, etc.
Diagnosticando Câncer de Próstata. A corporação Kaman de Ciências (Colorado Springs, CO) criou uma rede a qual pode predizer o câncer de próstata. Este sistema foi apresentado na "CNN" (canal de televisão) e no "Jornal Wall Street" como um grande avanço tecnológico. Redes foram treinadas para predizer resultados baseados em teste de PSA ("Prostate Specific Antigen) e para predizer a recorrência de câncer depois do tratamento.
Prevendo permanência de paciente. Um grupo da Escola de Medicina da Universidade Johns Hopkins desenvolveu uma rede neural para prever quais pacientes na Unidade de Tratamento Intensivo (UTI) cirúrgico do Hospital iriam permanecer sete ou mais dias. As entradas da rede incluíam idade, o uso de droga ou outras terapias, e sinais fisiológicos tais como taxa cardíaca e pressão sangüínea, e resultados de laboratório tais como contagens de células brancas. Um estudo da Hopkins concluiu que as "três redes neurais foram substancialmente melhores modelos preditivos do que o modelo de regressão linear múltipla..." Em uma aplicação similar, um grupo do Hospital de St. Michael em Toronto, Canadá, desenvolveu uma rede neural para prever o tempo de estadia de um paciente seguido à cirurgia cardíaca.
Prevendo custos de tratamento. Os médicos e administradores da Clínica Cleveland desenvolveram uma rede neural a qual prediz o custo associado com cateterização e intervenção no coração. A rede prediz se o paciente irá ser um caso normal ou de alto custo. As entradas incluem idade do paciente, sexo, e outros parâmetros médicos tal como dados estruturais sobre o coração do paciente e vasos sangüíneos.
Determinando significância de drogas. O grupo de pesquisa da "Zeneca Pharmaceuticals" em Wilmington, DE, desenvolveu uma aplicação de rede neural para examinar dados de experimentos com drogas os quais reduzem o tempo de análise em até 68%. A rede neural foi treinada para detectar "bons" picos de pressão da bexiga de centenas de picos em arquivos de dados. Estes picos são críticos para determinar a significância da droga em experimentos desenhados como "screening" de mais compostos de droga. Os pesquisadores previamente usaram o método do papel e o lápis para analisar estes picos, um método que levou 40 horas por mês. Usando redes neurais, reduziu o tempo de análise para 13 horas por mês.
Monitorando sinais fisiológicos. A Escola de Medicina da Universidade do Colorado desenvolveu um aplicação consistindo de quatro redes neurais as quais detectam anormalidades respiratórias por malfunções em equipamentos quando um paciente está sob anestesia.
Monitorando sistemas cardiovasculares. O Laboratório Nacional do Noroeste do Pacífico desenvolveu um algoritmo de treinamento que recebe dados fisiológicos tais como taxa cardíaca e respiratória de um monitor usado por um indivíduo e descreve um modelo do sistema cardiovascular da pessoa. Este modelo pode ser usado para predizer o que seria a resposta da pessoa em uma situação particular (tal como combatendo fogo ou envolvendo-se em atividade policial) ou para predizer a saúde de um indivíduo ao longo do tempo.
Por causa da sua natureza analítica e familiaridade com estatística, cientistas foram os primeiros adaptadores da tecnologia de redes neurais.
Modelagem da cinética de uma reação química. Um centro de pesquisa química tem modelado a taxa de reações químicas quando a temperatura e quantidade de catálise são alteradas. O centro está examinando outras aplicações, incluindo monitorar e controlar uma planta de processamento químico, predizendo propriedades tais como força e elasticidade para uma mistura química baseada nas entradas, e prevendo vendas.
Identificando químicos com um nariz artificial. O Laboratório Nacional do Noroeste do Pacífico desenvolveu um "nariz artificial" que é estimulado ao entrar em contato um vapor químico sobre seu sensor. Os sinais do sensor então alimentam a rede neural, a qual identifica o químico. O nariz pode ser usado para identificar químicos em ambientes perigosos ou para monitorar qualidade do ar. Outras aplicações em potencial incluem usar o nariz para avaliar odores corporais para identificar possíveis problemas médicos e monitorar qualidade na indústria de alimentos.
Monitorando qualidade de produto. O estado da Flórida usou redes neurais para corroborar com um requerimento da "Food and Drug Administration" para que o processador liste sobre o recipiente, o país ou estado de origem para cada lote de suco.
Os padrões de treinamento da rede foram tirados de uma base de dados que analisou amostras de suco de laranja de diferentes estados e países para a presença de 15 minerais, tais como sódio, cálcio, potássio, etc. Os cientistas usaram espectrometria de emissão de plasma atômico duplo para medir as quantidades de minerais em cada amostra.
Algoritmo. 1. Processo de cálculo, ou de resolução de um grupo de problemas semelhantes, em que se estipulam, com generalidade e sem restrições, regras formais para a obtenção do resultado, ou da solução do problema. 2. Dados. Conjunto predeterminado e bem definido de regras e processos destinados à solução de um problema, com um número finito de etapas.
Camada. Uma camada é um agrupamento de slabs (uma slab é uma camada de neurônios) em uma rede. Pode haver uma única slab em uma camada ou slabs múltiplas na mesma camada. Há somente uma camada de entrada e uma camada de saída em uma rede. Podem haver múltiplas camadas ocultas.
Momento. Grandes taxas de aprendizado freqüentemente levam à oscilação de mudanças de pesos e o aprendizado nunca se completa, ou o modelo converge a uma solução que não é ótima. Uma maneira que permite mais rápido aprendizado sem oscilação é fazer a mudança de peso uma função da prévia mudança de peso para permitir um efeito suavizador. O fator momento determina a proporção da última mudança de peso que é adicionada na nova mudança de peso.
Neurônio. Um neurônio é o bloco de construção básico de redes de simulação neuronal, o qual processa um número de valores de entrada para produzir um valor de saída. Geralmente, um neurônio soma os valores de entrada e então aplica uma função não-linear à soma para chegar aos valores de saída.
Pesos. Como os neurônios passam valores de uma camada da rede para a próxima camada nas redes de Retropropagação, os valores são modificados por um valor de peso na ligação que representa as forças de conexão entre os neurônios.
Padrão. Um padrão é um registro único (ou linha) de variáveis que influenciam as predições ou classificações da rede. Para redes supervisionadas (retropropagação, PNN, GRNN e GMDH), um padrão consiste de entradas e saídas. Para redes não supervisionadas, um padrão consiste só de entradas. Cientistas podem chamar um padrão de observação.
Polinômios. Forma algébrica racional inteira.
Regressões. A análise de regressão é uma ferramenta estatística que utiliza a relação entre duas ou mais variáveis quantitativas, onde uma variável pode ser predita a partir de outra. Um modelo de regressão é um meio formal de expressão da tendência da variável dependente variar com a independente de modo sistemático e da distribuição de pontos em torno da curva de relação estatística entre essas variáveis.
Sobreajuste. Quando utiliza-se variáveis que tem importância na resposta.
Sobreviventes. O termo sobrevivente é usado em GMDH para denotar qualquer um dos modelos candidatos que dão a melhor aproximação da variável de saída sob um critério de avaliação. A nova camada de sobreviventes é usada como entrada na construção da próxima camada na rede.
Taxa de aprendizagem. Cada vez que um padrão é apresentado à rede, os pesos que levam a um nódulo de saída são levemente modificados durante o aprendizado na direção requerida para produzir um menor erro a próxima vez que o mesmo padrão for apresentado. A quantidade de modificação de pesos é a taxa de aprendizagem. Por exemplo, se um taxa de aprendizagem é 0,5, a mudança de peso é só 50% do erro. Quanto maior a taxa de aprendizagem, maiores as mudanças de pesos, e mais rápido o aprendizado será procedido. Oscilação ou não convergência pode ocorrer se a taxa de aprendizagem é muito grande.
Variável de entrada. Uma entrada é uma variável que uma rede usa para fazer uma classificação ou predição. Cientistas a chamam de variável independente (x).
Variável de saída. Uma saída é o valor ou valores que a rede está tentando predizer ou os valores classificatórios se a rede é de classificações de padrões. Cientistas a chamam de variável dependente (y).
www.guahyba.vet.br