Uploaded by ricardo kayseller

Projeto Marketing Analytics - The Churn Game

advertisement
MARKETING INTELLIGENCE
ANO LETIVO: 2022/2023
DOCENTE: JOÃO GUERREIRO
MARKETING
ANALYTICS
THE CHURN GAME
Catarina Noronha, Inês Estrompa, Miguel Mendes, Sofia Costa
98557
98365
98903
98506
MARKETING INTELLIGENCE
02
ÍNDICE
1. INTRODUÇÃO
03
2. BUSINESS UNDERSTANDING
04
a. Avaliação Detalhada da Situação
b. Churn
c. Objetivos do Relatório
3.METODOLOGIA DO TRATAMENTO DOS
DADOS
a. Data Understanding
1. Recolha de Dados Inicial
2. Análise Descritiva e Exploratória
3. Validação da Qualidade dos Dados
b. Data Preparation
1. Escolha das Variáveis
2. Limpeza dos Dados
3. Construção dos Dados
4. Formatação dos Dados
c. Modeling
1. Seleção das Técnicas de Modelação
2. Definição do Plano de Avaliação
4.ANÁLISE DOS RESULTADOS
04
05
05
06
06
06
06
08
09
09
10
11
11
12
12
12
13
a. Escolha do Modelo
b. Análise do Modelo C5.0
13
5.ANÁLISE CRÍTICA
17
6.ANEXOS
18
14
MARKETING INTELLIGENCE
03
1. INTRODUÇÃO
No âmbito da Unidade Curricular de Marketing
Intelligence, foi proposto ao grupo a realização de um
projeto de Marketing Analytics, com o objetivo de criar
um modelo preditivo do abandono de um serviço de
telecomunicações fictício, num determinado período
de tempo.
O caso encontra-se no documento "Cell2Cell_Case",
que relata a existência de uma empresa fictícia de
telecomunicações
Cell2Cell;
os
dados
foram
disponibilizados
através
do
documento
"Cell2Cell_Data" em conjunto com o documento
"Cell2Cell_Data_Documentation" que realiza uma
descrição das variáveis presentes na base de dados.
Para efetuarmos a nossa análise, recorremos ao
programa IBM SPSS Modeler 18.3, onde realizámos
uma análise descritiva e exploratória da nossa amostra;
de seguida procedemos à validação dos dados
recolhidos; de seguida passámos à construção e
formatação dos dados para que estes pudessem ser
corretamente analisados pelos modelos de previsão
escolhidos.
Assim, após todo o processo de preparação da base de
dados, seguimos para a análise dos resultados obtidos
através dos modelos de previsão.
Finalmente, gostaríamos de referir que para
realização deste relatório procurámos seguir
metodologia CRISP-DM o mais próximo possível.
a
a
Marketing Intelligence
2. BUSINESS UNDERSTANDING
A Cell2Cell é a 6ª maior operadora dos EUA com cerca de 10 milhões de
utilizadores. Presente em mais de 2900 cidades e comunidades, servindo assim 210
mercados metropolitanos em cerca de 50 estados. Começando como uma empresa
familiar, a Cell2Cell cresceu exponencialmente tendo atualmente cerca de 20 000
empregados.
Esta empresa está inserida no mercado das telecomunicações, mercado este que
teve um crescimento considerável durante os anos 90, acabando por estabilizar em
2009.
As maiores forças da empresa são a infraestrutura de network e marketing, sendo as
suas campanhas de marketing focadas no reconhecimento da marca, a qualidade e
cobertura do serviço.
a ) Avaliação detalhada da situação
O problema começou quando se registou uma diminuição no número de novos
clientes e um ligeiro aumento no churn, gerando uma maior pressão para os
gestores de marketing.
Assim, este departamento estava encarregue de desenvolver e executar uma
estratégia virada para o cliente, com o objetivo de construir a marca Cell2Cell;
posicioná-la como a primeira escolha (top of mind); e gerar visitas para as lojas
afiliadas, ou seja, campanhas de reconhecimento da marca.
Esta estratégia resultou muito bem enquanto a procura por serviços sem fio se
manteve em crescimento. No entanto, esta começou a falhar, pois não conseguia
acompanhar as novas necessidades do Millenium.
Neste contexto, houve uma necessidade de mudança; focar a estratégia no
desenvolvimento e retenção de clientes.
Para isso, foi criado um novo departamento denominado de Customer Base
Management Group (CBM Group) que ficou responsável de gerar receita,
estimulando os atuais clientes a consumir mais dos produtos que possuem, por
exemplo aumentar os minutos, adicionar mais características/funções aos seus
planos ou adicionar diferentes produtos, e elaborar estratégias para reduzir o
churn.
04
Marketing Intelligence
b) Churn
O churn é um grande problema nesta empresa. Além de custar milhões de dólares, a
solução para este problema é muito complexa.
A Cell2Cell apresenta um Churn Rate Mensal de cerca de 4%. Metade deste churn é
involuntário, ou seja, o cliente não paga a conta e esta é encerrada. Porém, a outra
metade é voluntária, isto é, o cliente por algum motivo decidiu sair da empresa,
sendo esta a metade que a empresa tem de se focar.
Inicialmente, foi implementado um programa de retenção reativo, direcionado para
a retenção dos clientes que demostravam vontade de abandonar a empresa. Depois,
foi implementado um programa proativo, que identificava potenciais churners com
antecedência e tentava evitar que estes sentissem a necessidade de abandonar a
operadora. Porém, nenhum deles resultou a longo prazo.
Assim, houve a necessidade de desenvolver um modelo de previsão do churn.
c) Objetivos do Relatório
01
Elaborar um modelo preciso preditivo do churn, que classifique os
clientes relativamente à sua propensão para o abandono do serviço.
02
Interpretar os resultados do modelo de forma a explicar os fatores mais
importantes que expliquem o seu abandono.
05
Marketing Intelligence
a) Data Understanding
1. Recolha de dados inicial
Relativamente à recolha dos dados, o caso não informa como estes foram
recolhidos o que limita a nossa análise em certos aspetos. Um exemplo, no caso de
outliers e extremos não conseguimos dizer, com certeza absoluta, o que deve ser
feito com os mesmos, dado à falta de informação da metodologia na recolha dos
dados. Não é possível saber se são resultantes de um erro de imputação,
amostragem, ou qualquer outro método.
Adicionalmente, também não nos é
informado exatamente de onde os dados
surgem. O caso foi criado pela Teradata
Center
for
Customer
Relationship
Management, na Duke University nos EUA,
logo assumimos que os dados tenham
surgido desta organização; mas não nos é
possível concluir se os dados são reais ou
fictícios, tal como a empresa "Cell2Cell".
2. Análise Descritiva e Exploratória
A base de dados utilizada é composta por 71.047 clientes da empresa Cell2Cell ( este
número inclui clientes atuais e os que já abandonaram os serviço) e os clientes são
caracterizados por 78 variáveis.
De modo a simplificar a análise neste relatório, iremos abordar apenas as variáveis
que irão surgir como resultado dos modelos aplicados, estas sendo:
06
Marketing Intelligence
07
Tabela 1 - Variáveis Quantitativas resultantes do Modelo C5.0
Variável
Target
Tabela 2 - Variáveis Qualitativas resultantes do Modelo C5.0
Marketing Intelligence
3. Validação da Qualidade dos dados
Através da Análise Descritiva e Exploratória dos dados, detetámos uma variável
com valores absurdos, nomeadamente a variável “eqpdays” tendo valores abaixo de
0; sendo esta uma variável que descreve "o número de dias que o cliente tem com o
seu equipamento atual”, ou seja, é impossível um cliente ter o seu telemóvel num
número de dias abaixo de 0 (Anexo 1).
Adicionalmente, realizámos uma análise, através do software SPSS Modeler, para
detetar possíveis outliers e valores extremos, e foi detetado que maioria das
variáveis com medida "Continuous" demonstravam casos com valores outliers e
extremos, com algumas variáveis chegando a números superiores a 1000 outliers, e
outra a 1200 extremos (Anexo 2). Mencionamos ainda que os valores atribuídos para
a deteção dos outliers foram 3,0 e o dos extremos de 5,0, não tendo razões para
aumentar ou diminuir estes valores dada a falta de informação da metodologia de
recolha dos dados (Anexo 3).
Finalmente, também procurámos detetar se existiam valores omissos na base de
dados, e foram detetados certos clientes que não tinham todos os campos
preenchidos, sendo que o maior peso de casos omissos detetados numa variável foi
apenas de, aproximadamente, 1,751% sob o total de clientes (Anexo 4).
É importante referir que as duas variáveis com maior número de casos omissos são
a "age1" e "age2", que se referem à "idade do primeiro membro do agregado familiar"
e "idade do segundo membro do agregado familiar", respetivamente. Uma possível
causa para a existência de casos omissos nestas variáveis pode ser a falta de
membros no agregado familiar do cliente, ou seja o cliente vive sozinho.
Para as restantes variáveis é difícil obter conclusões face à falta de informação da
recolha de dados.
08
Marketing Intelligence
b) Data Preparation
1. Escolha das Variáveis
Após a análise de Business Understanding, em conjunto com a interpretação do
documento “Cell2Cell_Data_Documentation” que descreve cada variável, optámos
por remover 3 tipos de variáveis.
O primeiro, são variáveis criadas previamente para a calibração de modelos de
previsão. Sendo que o software SPSS Modeler realiza a criação destas variáveis
optámos por remover as previamente criadas, estas sendo: “churndep”, que serve
para a amostra de validação de modelos, e “calibrat”, que serve para a calibração das
amostras.
O segundo tipo de variáveis são as de “afirmação de missing data”, que nos
informam que não temos informação num determinado cliente relativamente a
outras variáveis. Estas não nos serão úteis na nossa análise considerando os nossos
objetivos, como tal serão removidas. Estas são: “ownrent”, que nos informa que não
temos informação relativamente ao facto de o cliente ter casa ou não, “marryun”,
que nos informa que não temos informações relativamente ao facto do cliente ser
casado ou não, “incmiss”, que nos informa que não temos informação relativamente
ao rendimento do cliente, e “setprcm”, que nos informa que não sabemos o preço
do equipamento atual do cliente.
O terceiro tipo de variável que optámos por remover são as que, após o Business
Understanding, considerámos que não iriam influenciar o churn, por abordarem
tópicos que não são relacionados com o serviço de telecomunicações e dificilmente
influenciariam o abandono de serviço. Estas são: “customer”, que se trata do
número de identificação do cliente; “truck”, que nos informa que o cliente é dono de
um camião; “rv”, que nos informa que o cliente é dono de um veículo recreativo;
“pcown”, que nos informa que o cliente é dono de um computador pessoal, e
“mcycle”, que nos informa que o cliente é dono de uma mota.
09
Marketing Intelligence
2. Limpeza dos Dados
Como foi referido na Análise Descritiva e Exploratória, existe uma variável com
dados que, dado o contexto, são impossíveis. A variável “eqpdays” descreve “o
número de dias que o cliente tem com o seu equipamento atual”, cujos valores se
referem ao número de dias; sendo assim, valores negativos são necessariamente
absurdos. Face ao exposto, optámos por remover os clientes com valores negativos
nesta variável (Anexo 5).
Relativamente ao caso de outliers e extremos, optámos, por precaução, manter os
outliers, mas remover os extremos. Esta decisão centra-se no facto de não termos
informação relativamente à recolha dos dados; como tal não podemos considerar se
estes casos ocorrem por erros de imputação, amostragem ou no próprio processo
de recolha de dados. Para alcançar isto, aplicámos um SuperNode de “Coerce
Outliers / Discard Extremes”.
Relativamente aos valores omissos, sendo que não existia nenhuma variável com um
número significativo de casos omissos, sendo o maior peso de casos omissos numa
variável apenas aproximadamente 1,751% sob o total da amostra, optámos por
manter estes casos e respetivas variáveis, por não afetarem os modelos utilizados
de uma forma considerável.
No final, continuámos com 63.493 casos válidos de clientes.
10
Marketing Intelligence
3. Construção dos Dados
Nesta fase, face à análise realizada na Análise Descritiva e Exploratória dos dados,
optámos por remover 55% dos clientes cujo valor do "churn" era igual a 0 (não
abandonaram o serviço), através do Balance node do SPSS Modeler (Anexo 6).
A razão principal que nos levou a esta decisão foi devido ao facto de que, sem
realizar esta remoção de dados, os Modelos escolhidos chegavam a resultados que
inicialmente parecem satisfatórios, tendo uma precisão de casos corretos acima de
70%, mas que após uma segunda análise, tinham um peso significativo de previsões
com casos falsos-positivos; isto é, o modelo detetava incorretamente casos de
abandono do serviço ("churn = 1") 95% das vezes que tentava prever o abandono
(Anexo 7).
Assim, acabámos por ter 38.616 clientes para utilizar nos modelos de previsão. É
importante referir que isto ocorreu em todos os modelos que foram utilizados.
4. Formatação de Dados
Tendo como objetivo aumentar a precisão dos modelos que foram utilizados, e a
fiabilidade dos mesmos, optámos por fazer partição dos dados através do node
Partition no SPSS Modeler.
Dado o número elevado de clientes (n=38.616) na nossa base de dados após a
remoção de extremos e casos absurdos, optámos por atribuir 70% dos dados para
treino (27.031 clientes) dos modelos e 30% para testagem dos resultados dos
mesmos (11.585 clientes).
Após alguns testes, detetámos que aumentar o número de casos para treino dos
modelos não aumentava a precisão dos modelos, nem diminuía o número de casos
falsos-negativos e falsos-positivos.
11
Marketing Intelligence
12
C) Modeling
1. Seleção das técnicas de Modelação
Para a realização da nossa análise, optámos por utilizar as seguintes ferramentas
disponibilizadas pelo software SPSS Modeler:
Árvores de Decisão (C5.0 e C&R Tree)
Regressão Linear (Logistic Regression)
Rede Neuronal (Neural Net)
A escolha destes modelos centra-se na necessidade de procurar o modelo preditivo
com maior precisão, com o objetivo de podermos tirar conclusões mais credíveis
relativamente aos fatores que afetam o churn e, consequentemente, como prevê-lo.
2. Definição do Plano de Avaliação
Como método de avaliação da precisão dos modelos, iremos considerar cada
modelo que tiver uma precisão acima de 70% como indicador credível na previsão
da variável "churn", e abaixo de 70% mas acima de 60% como apenas possível
possível tendência para o churn, não podendo tirar conclusões concretas.
Finalmente, iremos optar por analisar o modelo com maior peso de casos com
previsões de abandono verdadeiro (prevê "churn = 1", e é "churn = 1"), ou seja o maior
peso de casos verdadeiros positivos face ao número total de casos positivos.
Esta decisão centra-se no facto que, como iremos relatar na fase de Análise dos
Resultados, os modelos escolhidos não adquiriram precisões que nos permitam
tirar conclusões credíveis relativamente ao que verdadeiramente influencia o
abandono do serviço da empresa Cell2Cell, mas que nos indicam uma possível
relação entre algumas variáveis e o churn.
Marketing Intelligence
13
4. ANÁLISE DOS RESULTADOS
a) Escolha do Modelo
Após toda a preparação dos dados e os modelos previamente mencionados,
obtemos 4 modelos de possível análise com diferentes precisões:
Árvores de Decisão
Começando com o modelo C5.0, este apresenta uma precisão de 60,99% e obteve
previsões de 11.493 casos negativos verdadeiros (60,576% do total de previsões
negativas) e 10.806 casos positivos verdadeiros (60,301% do total de previsões
positivas) (Anexo 8). Dada a precisão e o peso dos casos positivos e negativos
verdadeiros, este modelo não é adequado para determinar com credibilidade e
certeza quais os fatores que levam ao churn, mas consegue mostrar certas
variáveis que tendem para o churn.
O modelo C&R Tree apresenta uma precisão de 59,15%; obteve previsões de 12.770
casos negativos verdadeiros (68,893% do total de previsões negativas) e 8.952 casos
positivos verdadeiros (48,955% do total de previsões positivas) (Anexo 9). Dada a
precisão e peso dos casos positivos verdadeiros, este modelo não é adequado para
determinar com credibilidade e certeza quais os fatores que levam ao churn nem
possíveis variáveis que tendem para o mesmo.
Regressão Linear
O modelo de Logistic Regression apresenta uma precisão de 58,31%; obteve
previsões de 12.594 casos negativos verdadeiros (68,068% do total de previsões
negativas) e 8.855 casos positivos verdadeiros (48,425% do total de previsões
positivas) (Anexo 10). Dada a precisão e peso dos casos positivos verdadeiros, este
modelo não é adequado para determinar com credibilidade e certeza quais os
fatores que levam ao churn nem possíveis variáveis que tendem para o mesmo.
Marketing Intelligence
14
Rede Neuronal
O modelo de Neural Net apresenta uma precisão de 56,4%, obteve previsões em
que 59,2% dos casos negativos eram negativos verdadeiros, sendo 53,2% dos casos
positivos casos positivos verdadeiros (Anexo 11). Dado a precisão e peso dos casos
positivos verdadeiros, este modelo não é adequado para determinar com
credibilidade e certeza quais os fatores que levam ao churn nem possíveis variáveis
que tendem para o mesmo.
Escolha do Modelo
Face aos resultados obtidos, o modelo mais apropriado para a nossa análise é o
modelo C5.0. Dito isto, torna-se relevante mencionar que, assim sendo, não será
possível alcançar os objetivos mencionados neste relatório, mas podemos destacar
certas variáveis que podem condicionar ao churn através do resultado deste
modelo.
b) Análise do Modelo C5.0
Através do modelo C5.0, obteve-se uma árvore de decisão que analisa 27.043
clientes e tem uma precisão de 60,99%, ou seja, prevê corretamente se o cliente vai
abandonar ou não, o serviço da Cell2Cell, 60,99% das vezes que realiza uma
previsão. Adicionalmente, a árvore resultante do modelo tem uma profundidade de
18 Nodes e um total de 75 Nodes. Face a este resultado, iremos apenas considerar
Nodes de menor entropia na nossa análise.
Por questões técnicas, tornou-se impossível incluir a árvore de decisão na sua
totalidade neste relatório; como consequência os diferentes percursos serão
incluídos nos anexos.
Pegando na árvore de decisão gerada pelo algoritmo, é de notar que a primeira
separação realizada pelo modelo é na variável “mou” (Anexo 12), em que se verifica
que 80,505% (n=436) dos clientes que têm minutos de chamada mensais abaixo ou
igual a 0 tendem a abandonar o serviço. É notável que foi a primeira separação que
o modelo C5.0 realizou, em que conseguiu imediatamente gerar um node com
entropia relativamente baixa, onde existe concordância para o abandono,
sugerindo que clientes que não chegam a realizar chamadas tendem a abandonar o
serviço independentemente de outros fatores.
Marketing Intelligence
15
A partir daí, os nodes com menor entropia para o lado de “churn = 1” começam a ter
uma maior profundidade. Como por exemplo:
Ramo 1 - Node 8 (Anexo 13)
Clientes com “mou” superiores a 0; com “months” inferiores ou iguais a 10,5;
“eqpdays” inferiores ou iguais 302,5; valores de “recchrge” inferiores ou iguais a
37,996 mas superiores a 22,02 e com “travel = 1” (realizaram viagens para fora dos
EUA) tendem a abandonar o serviço 78,947% (n=19) das vezes. É de notar que a
árvore segue um nível de entropia relativamente alto até ao Node 8, indicando que a
variável “travel” ter o seu valor igual a 1 possa ser o fator que mais influencia ao
abandono neste percurso.
Ramo 2 - Node 25 (Anexo 14)
Clientes com “mou” superiores a 0; com “months” superior a 12,5; com “retcalls”
inferior ou igual a 0,327; “eqpdays” inferior ou igual a 314,5; “models” inferior ou
igual a 1,5 e “uniqsubs” superiores a 2,5; tendem a abandonar o serviço 78,571%
(n=28) das vezes. É de notar que a árvore segue um nível de entropia relativamente
alto até ao Node 25, indicando que a variável “uniqsubs” seja superior a 2,5 valores
possa ser o fator que mais influencia ao abandono neste percurso.
Ramo 3 - Node 74 (Anexo 15)
Clientes com “mou” superior a 0; com “months” superior a 12,5; com “retcalls”
inferior ou igual a 0,327; “eqpdays” superior a 314,5; “roam” superior a 8,161 e
“opeakvce” inferior ou igual a 117,166; tendem a abandonar o serviço 71,145% (n=260)
das vezes. É de notar que a árvore segue um nível de entropia relativamente alto até
ao Node 74, indicando que a variável “opeakvce” seja inferior ou igual a 117,166
valores possa ser o fator que mais influencia ao abandono neste percurso.
Ramo 4 - Node 41 (Anexo 16)
Clientes com “mou” superior a 0; com “months” superior a 12,5; com “retcalls”
inferior ou igual a 0,327; “eqpdays” superior a 314,5; “roam” inferior ou igual a 8,161;
“changem” superior a -164,875; “webcap = 1” (equipamento tem capacidade de
acesso à internet); “recchrge” inferior ou igual a 75,213; “age1” menor ou igual a 57;
“creditde = 1” (tem rating de crédito baixo) e “occcler = 1” (trabalha no clero), tendem
a abandonar o serviço 90% das vezes (n=10). É de notar que a árvore segue um nível
de entropia relativamente alto até ao Node 41, indicando que a variável “occcler” ter
o seu valor igual a 1 possa ser o fator que mais influencia ao abandono neste
percurso.
Marketing Intelligence
16
Ramo 5 - Node 70 (Anexo 17)
Clientes com “mou” superior a 0, com “months” superior a 12,5; com “retcalls”
inferior ou igual a 0,327; “eqpdays” superior a 314,5; “roam” inferior ou igual a 8,161;
“changem” superior a -164,875; “webcap = 0” (equipamento não tem capacidade de
acesso à internet), com “phones” menor ou igual a 3,5; “credit = 0” (não tem rating
de crédito baixo), “incalls” superior a 10,833 e “newcelln = 1” (sabe-se que não é um
utilizador novo de telemóveis), tendem a abandonar o serviço 75% das vezes (n=24).
É de notar que a árvore segue um nível de entropia relativamente alto até ao Node
70, indicando que a variável “newcelln” ter o seu valor igual a 1 possa ser o fator
que mais influencia ao abandono neste percurso.
Marketing Intelligence
5. ANÁLISE CRÍTICA
O maior fator influenciador ao abandono do serviço da Cell2Cell, de acordo com os
resultados do modelo C5.0, será os minutos de chamada do cliente ("mou"), em que
se um cliente não realizar chamadas, ou não tiver minutos de chamada, terá uma
probabilidade significativa de abandonar o serviço (80,505%). Face à análise
realizada durante o Business Understanding, esta tendência faz sentido, pois um
cliente que não realiza chamadas poderá reconsiderar a sua subscrição a um serviço
de telecomunicações.
Adicionalmente, o facto de o cliente viajar para fora dos EUA (“travel”) também
mostra uma tendência de influenciar o churn; uma possível causa pode ser a
disponibilidade do mesmo em regiões fora do país de origem da Cell2Cell. Outro
fator que também parece condicionar o churn é o facto de o cliente não ser um
novo utilizador de telemóveis (“newcelln”), sendo que este consequentemente
pode ter mais conhecimento relativamente aos serviços oferecidos pela Cell2Cell e
os considerar inadequados para as suas necessidades, ou optar por outra empresa
que melhor corresponda ao que procura.
As restantes variáveis, “uniqsubs”, “opeakvce” e “occcler”, também demonstram
influenciar o abandono ao serviço nos seus respetivos percursos, mas as possíveis
causas não são tão claras e exigem uma análise mais aprofundada, seja em nível de
recolha de dados ou de informação adicional do mercado de telecomunicações.
Contudo, torna-se relevante novamente referir que a precisão deste modelo, apesar
de ser a mais alta, com melhor rácio entre casos postivos/negativos
verdadeiros/falsos, continua a ser inadequada para afirmar com credibilidade que
estes fatores resultam no churn, sendo que apenas podemos afirmar que mostram
tendências para o mesmo.
Dito de outra forma, face à nossa preparação de dados, construção de modelos e
análise dos mesmos, não se tornou possível alcançar os objetivos estabelecidos na
fase de Business Understanding, estes sendo a elaboração de um modelo preciso
preditivo do churn, nem a interpretação dos resultados de forma a explicar o
abandono do serviço .
17
Marketing Intelligence
ANEXOS
Anexo 1 - Análise Exploratória da variável "eqpdays" com valores absurdos
Anexo 2 - Resultados da análise de Outliers e Extremos
18
Marketing Intelligence
ANEXOS
Anexo 3 - Configuração do Data Audit para detetar outliers e extremos
Anexo 4 - Deteção de casos omissos na base de dados
19
Marketing Intelligence
Anexo 5 - Remoção de casos absurdos na variável "eqpdays"
Anexo 6 - Remoção de 55% dos clientes com "churn = 0"
Anexo 7 - Precisão e rácios de casos positivos/negativos do modelo C5.0 sem realizar "Balancing" na variável churn
20
Marketing Intelligence
Anexo 8 - Resultados do Modelo C5.0
Anexo 9 - Resultados do Modelo C&R Tree
21
Marketing Intelligence
Anexo 10 - Resultados do Modelo Regressão Logística
Anexo 11 - Resultados do Modelo Neural Net
22
Marketing Intelligence
Anexo 12 - Ramo para o Node 1 - "mou" <= 0,000
Anexo 13 - Ramo 1 - Node 8 - "travel = 1,000"
Anexo 14 - Ramo 2 - Node 25 - "uniqsubs" > 2,500
23
Marketing Intelligence
Anexo 15 - Ramo 3 - Node 74 - "opeakvce" <= 117,116
Anexo 16 - Ramo 4 - Node 41 - "occcler = 1,000"
24
Marketing Intelligence
Anexo 17 - Ramo 5 - Node 74 - "newcelln = 1,000"
25
Download