ANÁLISE DE TEXTO, TRANSFORMAÇÃO e MODELAGEM DE TEXTO

É uma abordagem multidisciplinar para encontrar, extrair e revelar padrões em texto através de uma fusão de métodos analíticos, experiência de domínio e tecnologia. Essa abordagem inclui os domínio da inteligência artificial >machine learning >deep learning > processamento de linguagem natural > análise de texto. (combina princípios e práticas das áreas de matemática, estatística, inteligência artificial, engenharia de sistema e computação, linguística e ciência da informação para analisar grandes quantidades de dados)


MODELO DE INFORMAÇÃO

Nuvem de Palavras de um texto

Relacionamento entre Abordagens de Solução x Tipos de aprendizagem

no contexto da Ciência de Dados
Abordagem da Solução (algorítmo) Relação Tipos de aprendizagem
AS1 Classificação
É uma sub-categoria de aprendizagem supervisionada. Classificação é o processo de tomar algum tipo de entrada e atribuir um rótulo a ela. Sistemas de classificação são usados ​​geralmente quando as previsões são de natureza distinta, ou seja, um simples “sim ou não”. Exemplo: Mapeamento de uma imagem de uma pessoa e classificação como masculino ou feminino
AS1 TA1
AS2 TA1
TA1 Supervisionado

Os algoritmos são treinados a partir de exemplos rotulados.
O programador humano insere dados mostrando o que é “certo” e o que é “errado”.
O sistema, então, aprende a fazer comparações e a resposta que ele for dar vai ser com base nos exemplos que ele recebeu.
É quando apresentamos ao algoritmo dados de entrada e as respectivas saídas.

AS2 Regressão AS2 TA2
AS3 TA2
TA2 Não Supervisionado

o sistema age totalmente por si só. A ele não são colocados exemplos rotulados para que ele possa fazer comparações.
O “certo” e o “errado” não são informados ao sistema, cabendo a ele fazer a identificação de padrões e características em comum dos dados que são inseridos. É quando apresentamos somente os dados de entrada e o algoritmo descobre as saídas.

AS3 Agrupamento AS3 TA3
AS3 TA2
TA3 Semi Supervisionado

É uma abordagem de aprendizado de máquina que combina uma pequena quantidade de dados rotulados com uma grande quantidade de dados não rotulados durante o treinamento.

AS4 Associação --- TA4 Por Reforço

Treinamento de modelos de aprendizado de máquina para tomar uma sequência de decisões. O agente aprende a atingir uma meta em um ambiente incerto e potencialmente complexo. No aprendizado por reforço, o sistema de inteligência artificial enfrenta uma situação. O computador utiliza tentativa e erro para encontrar uma solução para o problema. Para que a máquina faça o que o programador deseja, a inteligência artificial recebe recompensas ou penalidades pelas ações que executa. Seu objetivo é maximizar a recompensa total. EX: Robótica e games.

CONTEXTO

A análise de texto esta no subdomínio deep leraning no tópico processamento de linguagem natural



Analise de dados x AnaliticsPreditivo


Ciclo da Inovação


Ciclo de BigData


Ciclo de Dados


Métricas, Indicadores, Indice e Meta

Métrica - Valor a ser medido em unidade quantitativa (ex:número de visitas,..) - operacional
Indicador - Relação entre duas métricas (variáveis). Variável orientado para a estratégia e o desempenho operacional da organização (ex:desempenho) - tática
Unidade - de medida são representações das grandezas físicas no resultado de um indicador.
Indice - é o valor (resultado) que se apura para um dado indicador num determinado momento (ex:IGP.
Meta - Quantitativo e um prazo para alcança-lo. Pode prever essa sazonalidade(estratégico). Ex: Manter desempenho dentro da meta.

Visão geral

PROJETO

Papel do ser humano

BIBLIOGRAFIA

Q que é ciência de dados?

Q que é ciência de dados?

Q que é Data Ops?

Livro Ciência de dados

Onde selecionar algoritmos?

14 Tipos diferentes de aprendizado de máquina

GLOSSÁRIO DE TERMOS