CONCEITOS

Ciência de Dados

O que é

É uma abordagem multidisciplinar para encontrar, extrair e revelar padrões em dados através de uma fusão de métodos analíticos, experiência de domínio e tecnologia.
Essa abordagem geralmente inclui os campos de mineração de dados, previsão, aprendizado de máquina, análise preditiva, estatística e análise de texto. (combina princípios e práticas das áreas de matemática, estatística, inteligência artificial, engenharia de sistema e computação, linguística e ciência da informação para analisar grandes quantidades de dados)

Contexto

Onde esta a Ciência de Dados no contexto do século XXI

A Ciência dos Dados esta complementar ao eixo da Ciência da informação estando as Ontologias como o outro eixo da Ciência da informação.

A Ciência dos Dados esta no reino dos dados não estruturados enquanto as ontologias estão no eixo dos reino estruturados.

MODELO DE INFORMAÇÃO

Relacionamento entre Abordagens de Solução x Tipos de aprendizagem

no contexto da Ciência de Dados
Abordagem da Solução (algorítmo) Relação Tipos de aprendizagem
AS1 Classificação
É uma sub-categoria de aprendizagem supervisionada. Classificação é o processo de tomar algum tipo de entrada e atribuir um rótulo a ela. Sistemas de classificação são usados ​​geralmente quando as previsões são de natureza distinta, ou seja, um simples “sim ou não”. Exemplo: Mapeamento de uma imagem de uma pessoa e classificação como masculino ou feminino
AS1 TA1
AS2 TA1
TA1 Supervisionado

Os algoritmos são treinados a partir de exemplos rotulados.
O programador humano insere dados mostrando o que é “certo” e o que é “errado”.
O sistema, então, aprende a fazer comparações e a resposta que ele for dar vai ser com base nos exemplos que ele recebeu.
É quando apresentamos ao algoritmo dados de entrada e as respectivas saídas.

AS2 Regressão AS2 TA2
AS3 TA2
TA2 Não Supervisionado

o sistema age totalmente por si só. A ele não são colocados exemplos rotulados para que ele possa fazer comparações.
O “certo” e o “errado” não são informados ao sistema, cabendo a ele fazer a identificação de padrões e características em comum dos dados que são inseridos. É quando apresentamos somente os dados de entrada e o algoritmo descobre as saídas.

AS3 Agrupamento AS3 TA3
AS3 TA2
TA3 Semi Supervisionado

É uma abordagem de aprendizado de máquina que combina uma pequena quantidade de dados rotulados com uma grande quantidade de dados não rotulados durante o treinamento.

AS4 Associação --- TA4 Por Reforço

Treinamento de modelos de aprendizado de máquina para tomar uma sequência de decisões. O agente aprende a atingir uma meta em um ambiente incerto e potencialmente complexo. No aprendizado por reforço, o sistema de inteligência artificial enfrenta uma situação. O computador utiliza tentativa e erro para encontrar uma solução para o problema. Para que a máquina faça o que o programador deseja, a inteligência artificial recebe recompensas ou penalidades pelas ações que executa. Seu objetivo é maximizar a recompensa total. EX: Robótica e games.

CONTEXTO


Analise de dados x AnaliticsPreditivo


Ciclo da Inovação


Ciclo de BigData


Ciclo de Dados


Métricas, Indicadores, Indice e Meta



Métrica - Valor a ser medido em unidade quantitativa (ex:número de visitas,..) - operacional

Indicador - Relação entre duas métricas (variáveis). Variável orientado para a estratégia e o desempenho operacional da organização (ex:desempenho) - tática

Unidade - de medida são representações das grandezas físicas no resultado de um indicador.

Indice - é o valor (resultado) que se apura para um dado indicador num determinado momento (ex:IGP).

Meta - Quantitativo e um prazo para alcança-lo. Pode prever essa sazonalidade(estratégico). Ex: Manter desempenho dentro da meta.

PROJETO

Papel do ser humano

Ciclo de vida

Etapa 1 e 2

Etapa 3 a 5

Etapa 6 e 7

BIBLIOGRAFIA

Q que é ciência de dados?

Q que é ciência de dados?

Q que é Data Ops?

Livro Ciência de dados

Como selecionar algoritmos?

14 Tipos de aprendizagem

REFERÊNCIA

Atividade 1 Curso Engehnaria de software aplicada a ciência de dados

Atividade 2 Curso Engehnaria de software aplicada a ciência de dados

GLOSSÁRIO DE TERMOS

ID Item Significado
1 Negocio Ocupação, Atividade
2 Serviço Obrigação
3 Produto Bem de uso, consumo
4 Sistema Forma de pensar, relacionamento de funções, funcionamento
5 Processo Forma de fazer, grupo de atividade, sequenciar
6 Estrutura Arquitetura
7 Arquitetura Estrutura
8 Lazer
9 Ócio
10 Orbita Tudo gira em torno de
11 Pessoas Gente, saude vida, holistica
12 Visão Ver, direcionar
13 Modelo Forma de criar, evoluir
14 Cultura Hábito, dia a dia, rotina, educação
15 Técnica Habilidade, competência, procedimento
16 Método Abordagem estruturada, abordagem caótica (aleatória), caminho
17 Evento o que dispara, gatilho, ocorrencia
18 Transação Troca, vai e volta, ação e reação
19 Projeto Tem um objetivo, tem uma duração, escopo (contexto) e orçamento
20 Domínio Disciplina
21 Estilo Caracteristica, mensagem
22 Feacture Caracteristica, atributo, propriedade
23 Funcionalidade Função
24 Especificação Contexto, conteúdo, formato, estilo, direção
25 Usuário Quem usa
26 Steakhold Interesado
27 Cliente Quem paga
28 Dono Quem manda
29 Informação Matéria prima simbólica com significado
30 Entidade Qualquer coisa que agrupa e tem significado
31 Dado Valor, texto, objeto, som, video
32 Texto Meio que tem informação
33 Conceito Abstração que transmite significado
34 Objeto Qualquer coisa fisica
35 Documentação Informação contida em um meio
36 Conhecimento Um atributo de uma pessoa, quem sabe fazer.
37 Meio Dispositivo de transporte
38 Plano de negocio .
39 Modelo de negocio
40 Sistema É qualquer coisa divisivel funcionalmente e com funcionalidades interrelacionadas que atendem ou perseguem um objetivo e que se relaciona com seu ambiente externo através de interfaces informacional.