SYPNET INFORMÁTICA

assistência técnica especializada em unidades de backup

  • Full Screen
  • Wide Screen
  • Narrow Screen
  • Increase font size
  • Default font size
  • Decrease font size

Data Miner

E-mail Imprimir
O que é Data Mining?

Data Mining ou Mineração de Dados é a procura de relações e padrões globais que existem em bancos de dados, mas que estão escondidos pela vasta quantidade de informações, como um relacionamento entre dados de um paciente e seu diagnóstico médico. Estes relacionamentos representam conhecimento de valor sobre bancos de dados e objetos do banco de dados, podendo ser utilizados para decisões estratégias ou comerciais.
Por exemplo, tarefas como:
- identificar o perfil dos clientes compradores potenciais de determinados tipos de produtos.
- descobrir produtos que freqüentemente são comprados juntos.
- encontrar grupos distintos de clientes com características semelhantes.
Existem inúmeras técnicas descritas na literatura da área que permitem obter conhecimento de bases de dados.
No sistema Data Miner, optou-se pelo uso de 3 técnicas de características distintas, descritas a seguir:

Árvores de Decisão
- É um sistema de classificação, ou seja, que permite classificar um dado a partir de outros dados.
- Exemplo: A partir das informações: idade, sexo, classe social, cidade, estado civil e outros dados, classificar o perfil de compra dos clientes.
- Para obter um modelo de classificação, deve-se fornecer dados do passado (como transações financeiras realizadas pelos clientes nos últimos 6 meses) para que o sistema possa “induzir” um padrão geral nos dados que será representado pela saída de execução.
- A saída da execução é uma árvore que representa na forma de galhos os critérios que são utilizados para classificar os registros.
- Exemplo:
  -Se idade=entre 20 e 40 anos
   -Se Sexo=masculino
    - Se estado civil=casado
       - Perfil de compra=ótimo
- A partir de uma árvore de decisão gerada, é possível aplicá-la em novos dados para verificar a sua taxa de acerto, ou seja, o qual verdadeiras as regras propostas são, ou simular a partir de novos dados qual seria a resposta da árvore.

Clustering
- Permite agrupar os dados em conjuntos homogêneos. O número de conjuntos não precisa ser fornecido, de tal forma que o sistema tentará encontrar de forma automática os possíveis agrupamentos nos dados.
- Cada agrupamento será depois descrito pelas suas principais características, que permitirá fornecer “rótulos” aos grupos, como por exemplo: “Grupo dos clientes que compram determinados produtos” ou “Grupo dos clientes com perfil diferenciado de compra”.

Regra de Associação
- É uma das aplicações mais “clássicas” de Data Mining.
- Regras de Associação encontram padrões entre dados binários, expressos a partir e regras no formato SE... ENTÃO.
- As regras são obtidas a partir de um determinado nível de relevância mínimo pré-estabelecido (graus de suporte e confiança).
- O caso mais comum é a “Basket Data Analysis”, que visa encontrar itens que são freqüentemente comprados juntos pelos clientes.
- Exemplo: Se um cliente compra cerveja então compra fraldas (Suporte: 3% Confiança: 80%)
- O exemplo acima corresponde a um caso real aonde um supermercado descobriu que clientes que são casados, pais e novos costumam comprar fraldas e cervejas. Em posse deste conhecimento, um supermercado pode decidir colocar os produtos próximos ou oferecer promoções na compra conjunta.
- Entretanto, regras de associação não servem somente para analisar produtos que são comprados em conjunto, podendo ser aplicadas para encontrar padrões quaisquer entre dados que ocorrem de forma conjunta.

You are here