Promoções para atratividade de clientes no Mercado de ... · Tabela 1 - Histórico de ... desde...
Transcript of Promoções para atratividade de clientes no Mercado de ... · Tabela 1 - Histórico de ... desde...
Promoções para atratividade de clientes no Mercado de Retalho
de Moda Desportiva
por
Pedro Filipe Gonçalves Martins
Dissertação do Mestrado de Gestão Comercial
Orientado por
Professor Doutor Pedro José Ramos Moreira de Campos
2017
II
Resumo
A comunicação com os clientes é algo de extrema importância para todos os
retalhistas. A tipologia de comunicação das campanhas promocionais deve ser
cuidadosamente estudada por cada retalhista para melhorar a definição da estratégia a
aplicar em todos os veículos de comunicação. A sua correta aplicação terá impactos
significativos na rentabilidade da Empresa.
Este estudo pretende demonstrar qual a melhor tipologia de comunicação a
utilizar para a atratividade de clientes dentro do setor do mercado de retalho de Moda
Desportiva, comparando as tipologias promocionais de percentual e em euros, obtendo
melhores resultados na tipologia promocional em euros. A ausência de estudos nesta
área, motivou o desenvolvimento desta dissertação como um suporte à tomada de
decisão do plano promocional do retalhista.
Para determinar os clientes a serem abrangidos pelo estudo, é utilizado o Modelo
RFM, recorrendo-se ao algoritmo de K-means para efetuar o clustering dos clientes
consoante as classificações obtidas no Modelo. O clustering tem como propósito
encontrar o cluster que represente os clientes não leais, isto é já considerados como
perdidos pelo retalhista.
De forma a atingir o objetivo de determinar o tipo de promoção mais eficiente na
atração de cliente, serão efetuadas campanhas com diferentes tipologias promocionais
sobre o cluster de clientes perdidos, estas terão como objetivo paralelo a obtenção de
rentabilidade para o retalhista.
III
Abstract
The communication with clients is highly important to every retailer. The
communication typology for each promotional campaign must be carefully studied by
each retailer, in order to implement the best strategy in each communication vehicle.
With the right implementation, the strategy will have a strong impact in the company
profitability.
This study intends to present which is the best promotional typology, between
percentage and value, to be used in order to attract clients back to the store in the Sports
Fashion market, having the best results in the value promotional type. The reduced
number of studies in this area has motivated the creation of this dissertation as a support
to the decision making in the promotion plan.
RFM Model was used to classify the set of clients to be used in this study. A K-
means algorithm was used to perform the clustering according to the classifications
obtained in the previous model. The purpose of this clustering, is to find the cluster that
represents the non-loyal clients, i.e. the clients lost by the retailer.
To achieve the dissertation objective, which is to determine the most efficient
type of promotions to attract clients, different promotional campaigns will be realized
in the cluster of non-loyal clients. With this study we are also able to conclude which
is the best campaign typology to increase retailer profit.
IV
Índice
Resumo.......................................................................................................................... II
Abstract ........................................................................................................................ III
Índice de Figuras .......................................................................................................... VI
Índice de Tabelas ........................................................................................................VII
Índice de Gráficos ..................................................................................................... VIII
Tabela de Siglas ........................................................................................................... IX
1. Introdução .................................................................................................................. 1
2. Revisão de Literatura ................................................................................................. 5
2.1. Promoções de Vendas ......................................................................................... 5
2.2. Segmentação de Mercado ................................................................................... 7
2.3. Clustering ............................................................................................................ 8
2.3.1. Método Hierárquico ................................................................................... 10
2.3.1.1. BIRCH .................................................................................................... 11
2.3.1.2. TwoStep Cluster...................................................................................... 13
2.3.2. K-means ..................................................................................................... 14
2.4. Análise RFM ..................................................................................................... 17
3. Metodologia e Dados ............................................................................................... 19
3.1. Objetivo do estudo ............................................................................................ 19
3.2. Método de estudo .............................................................................................. 19
3.3. Definição da População e Amostra ................................................................... 20
3.4. Variáveis de Estudo e Análise RFM ................................................................. 21
4. Estudo do Caso ........................................................................................................ 23
4.1. Segmentação de clientes ................................................................................... 23
4.2. Comunicação com os clientes ........................................................................... 26
4.3. Identificação do cluster a observar.................................................................... 27
V
5. Análise de Resultados .............................................................................................. 36
5.1. Taxas de Conversão .......................................................................................... 36
5.2. Vendas Líquidas................................................................................................ 39
5.3. Ticket Médio ..................................................................................................... 43
5.4. Rentabilidade .................................................................................................... 45
5.5. Eficiência do Estudo ......................................................................................... 47
6. Conclusão................................................................................................................. 50
Bibliografia .................................................................................................................. 52
Anexos ......................................................................................................................... 55
VI
Índice de Figuras
Figura 1 - Graus de Segmentação (Oliveira-Brochado and Martins 2008) ................... 8
Figura 6 – Fases do algoritmo BIRCH (Zhang, Ramakrishnan, & Livny, 1996) ........ 12
Figura 2 - 1º passo K-means (Sarstedt & Mooi, 2014) ................................................ 15
Figura 3 - 2º passo K-means (Sarstedt & Mooi, 2014) ................................................ 15
Figura 4 - 3º passo K-means (Sarstedt & Mooi, 2014) ................................................ 16
Figura 5 - 4º passo K-means (Sarstedt & Mooi, 2014) ................................................ 16
Figura 7 - As 7 Unidades de negócio ........................................................................... 20
Figura 8 - Análise RFM – Seperador Variables........................................................... 28
Figura 9 - Análise RFM -Separador Binning............................................................... 28
Figura 10 - Análise RFM – Separador Output ............................................................. 29
Figura 11 - Análise RFM – Base de dados .................................................................. 29
Figura 12 - Algoritmo k-means .................................................................................... 30
VII
Índice de Tabelas
Tabela 1 - Histórico de Iterações em Calçado Futebol ................................................ 31
Tabela 2 - Centros de Clusters Iniciais e Finais de Calçado Futebol .......................... 31
Tabela 3 - Clientes por Cluster Calçado Futebol ......................................................... 31
Tabela 4 - Histórico de Iterações em Têxtil Fitness..................................................... 32
Tabela 5 - Centros Cluster Iniciais e Finais em Têxtil Fitness .................................... 33
Tabela 6 - Clientes por Cluster Têxtil Fitness ............................................................. 33
Tabela 7 - Histórico de Iterações de Calçado Running................................................ 34
Tabela 8 - Centros Cluster Iniciais e Finais Calçado Running .................................... 34
Tabela 9 - Clientes por Cluster Calçado Running ....................................................... 34
Tabela 10 - Percentagem de Consumo na Categoria ................................................... 40
Tabela 11 - Percentagem de Consumo na Empresa ..................................................... 42
Tabela 12 – Ticket Médio nas categorias..................................................................... 43
Tabela 13 – Ticket Médio na Empresa ........................................................................ 44
Tabela 14 – Peso da Margem na Categoria.................................................................. 45
Tabela 15 – Peso da Margem na Empresa ................................................................... 46
Tabela 16 - Eficiência da Tipologia promocional em Calçado Futebol ...................... 47
Tabela 17 - Eficiência da Tipologia promocional em Têxtil Fitness ........................... 48
Tabela 18 - Eficiência da Tipologia promocional em Calçado Running ..................... 49
VIII
Índice de Gráficos
Gráfico 1 - Taxa de conversão à categoria................................................................... 37
Gráfico 2 – Taxa de conversão na Empresa................................................................. 38
Gráfico 3 – Vendas liquídas na Categoria ................................................................... 40
Gráfico 4 – Vendas liquídas na Empresa ..................................................................... 41
Gráfico 5 – Margem em Euros na Categoria ............................................................... 45
Gráfico 6 – Margem em Euros na Empresa ................................................................. 46
IX
Tabela de Siglas
BD - Base de Dados
BIRCH - Balanced Iterative Reducing and Clustering using Hierarchies
CC - Centros de Clusters
CLV - Customer Lifetime Value
IVA - Imposto de Valor Acrescentado
PVP - Preço de Venda ao Público
RFM - Recency, Frequency, Monetary
1
1. Introdução
O Desporto em Portugal tem cerca de 560 mil atletas federados no ano de 2015 o
que representa um rácio de 54.7 praticantes federados por cada mil habitantes, segundo
dados da PORDATA (2017). Cada vez mais, a prática de desporto se torna habitual e algo
essencial para o bem-estar, desde uma corrida matinal ou noturna, uma ida ao ginásio ou
piscina, uma prática de Futebol ou outros desportos no convívio entre amigos, o que leva
a que cada vez mais portugueses pratiquem desporto em Portugal.
O âmbito desta dissertação está relacionado com o mercado de retalho de moda
desportiva em Portugal. Como retalho de moda desportiva consideram-se todas as lojas
de grandes Marcas ligadas ao Desporto (Ex: Nike, Adidas, Puma, entre muitas outras)
bem como retalhistas que tenham lojas multimarcas e/ou marcas próprias.
As 9 grandes marcas representam, segundo dados da Statista (2017), cerca de 75
biliões de dólares em Receitas anuais tratando-se de um mercado em crescimento nos
últimos anos.
A ausência de estudos detalhados nesta área atraiu o interesse do autor, bem como
a oportunidade de explorar um tema que assenta numa ótica de apoio à tomada de decisão
em ações comerciais com vista a potenciar a rentabilidade do negócio. Outro fator que
que conduziu ao desenvolvimento deste estudo foi a ausência de utilização da informação
que se encontra disponível na base de dados de clientes da entidade onde este atualmente
exerce funções. Para colmatar estas lacunas o autor propõe-se a desenvolver um estudo
em que pretende concluir qual a melhor tipologia de comunicação para atrair clientes de
volta à loja.
Na atualidade a utilização do marketing de massas têm-se tornado cada vez mais
incomum, o que levou a que o marketing individual atingisse um papel cada vez mais
relevante. Contudo o marketing de massa não deve ser esquecido, as Empresas devem ter
uma visão diferente escolhendo os grandes grupos de clientes onde atuar (Sun 2009).
Para atingir o objetivo proposto neste estudo, pretende-se realizar várias
segmentações do mercado por tipologia de desporto. De modo a atingir este objetivo
pretende-se utilizar como metodologia a análise RFM (Recência, Frequência e Valor
2
Monetário) e uma análise de clusters, com o intuito de criar grupos de clientes com
necessidades diferentes. Esta análise irá permitir definir segmentos de clientes mais
sensíveis ás campanhas efetuadas, evitando assim o desperdício de recursos em clientes
que teriam menor probabilidade de resposta à campanha efetuada.
A análise RFM é um conceito introduzido por Bult e Wansbeek (1995), que permite
classificar cada cliente com base nas suas três variáveis: Recência (R), Frequência (F) e
Monetarização (M); que representam respetivamente, a data desde a última compra, o
número de transações efetuadas, e o valor total gasto. A sua combinação com algoritmos
de clusters permite obter um maior conhecimento sobre o cliente (Birant 2011).
Existem vários métodos de segmentação de onde destacamos os métodos
Hierárquico e de Particionamento (Berkhin 2006). Dentro destes dois métodos abordar-
se-á mais concretamente os algoritmos: BIRCH (Balanced Iterative Reducing and
Clustering using Hierarchies), Two step cluster e o K-means. Sendo que neste estudo se
irá apenas utilizar um deles, em conjunto com a análise RFM, para determinação dos
clusters.
O estudo recorre a uma base de dados de cartão de cliente de um retalhista do setor
de moda desportiva. De forma a tirar um maior proveito sobre a segmentação realizar-se-
á um estudo sobre a eficácia de diferentes tipologias de campanhas promocionais no
mesmo segmento de cliente. As tipologias promocionais comparadas neste estudo serão
a de desconto em percentual e a de desconto em valor monetário. A primeira caracteriza-
se pela comunicação de uma percentagem de desconto sobre o preço de venda e a segunda
de uma comunicação do valor em euros de desconto a obter sobre o preço de venda.
Esta análise vai permitir a criação de clusters de clientes com diferentes tipos de
necessidade dentro de cada categoria de desporto em análise e posteriormente, após essa
definição, tem como finalidade a criação de campanhas específicas para o segmento de
clientes perdidos, ou seja, o cluster de clientes que apresente o valor de Recência mais
baixo. A escolha deste cluster deve-se ao facto de se admitir que os clientes com um valor
de Recência inferior apresentam a menor ligação à Empresa.
Para o estudo serão selecionadas as tipologias de artigo: têxtil e calçado, em
categorias como Running, Fitness e Futebol.
3
A análise de resultados deste estudo será efetuada em 4 bases distintas - taxa de
conversão, vendas líquidas, ticket médio e rentabilidade. Estas quatro bases são
consideradas pela Empresa, onde é efetuado o estudo como essenciais para determinar o
sucesso de todas as campanhas efetuadas.
Os objetivos da investigação consistem em decifrar a que tipologia de campanhas
os clientes “perdidos” das categorias escolhidas são mais sensíveis e consequentemente
sentem uma maior atração em retornar à loja.
Futuramente o autor prevê a realização deste estudo em todas as categorias da
Empresa de forma a obter uma visão completa e que permita encontrar alguns padrões
existentes entre diferentes tipologias de artigo ou categorias. Uma das implicações futuras
neste estudo é o de conseguir perceber dentro de cada uma das categorias analisadas como
se deve comunicar, quer em folhetos de campanhas quer em atividades promocionais nos
meios de comunicação social e redes sociais, para atrair novos clientes à loja.
Um dos objetivos a longo prazo desta dissertação é o de se conseguir efetuar numa
base regular, de forma a atrair o máximo possível de clientes que sejam “perdidos”.
Pretende-se também criar um grupo de controlo de forma a medir a sua taxa consequente
de retorno à loja, isto é perceber após o usufruto do benefício dado na 1º campanha aos
clientes perdidos, qual a percentagem do grupo de controlo que continua a visitar a loja
sem ter qualquer benefício que o motive.
O objetivo final desta dissertação é o de criar conhecimento dentro da área de
estudo, e acrescentar valor, isto é, trazer rentabilidade em cada campanha efetuada nos
diferentes grupos de clientes, já que, na área comercial, a rentabilidade é o foco pois
permite o aumento de valor do negócio.
A estrutura da dissertação encontra-se organizada da seguinte forma: na sequência
da introdução, é apresentada a revisão de literatura (Capítulo 2) referente às técnicas que
serão abordadas (Promoções de Vendas, Segmentação de Mercado, Clustering e Análise
RFM).
No Capítulo 3 são apresentadas as Metodologias e os Dados deste estudo, onde se
descreve os objetivos e o método de estudo, define-se a população, amostra e as variáveis
do estudo.
4
No Capítulo 4, é apresentado o estudo de caso, onde se detalha todo o processo
desde a segmentação da base de dados até à identificação do cluster a observar.
No Capítulo 5 encontra-se a Análise de resultados e no Capítulo 6 a conclusão.
5
2. Revisão de Literatura
Neste capítulo faz-se um enquadramento teórico das Promoções de Vendas,
Segmentação de Mercado, Clustering e Análise RFM, presentes no estudo, focando nas
ideias principais dos autores que se debruçam sobre a temática em estudo.
2.1. Promoções de Vendas
As Promoções de Vendas existem desde que as trocas de bens e valores se iniciaram
e foram evoluindo ao longo dos anos. Segundo Brito (2012), assumem diversas variantes:
Vales de descontos;
Cupões;
Reduções de preço;
Produtos Grátis;
Folhetos;
Programas de Fidelização;
Topo de Gondola;
Etc.
Estas variantes, segundo Schneider e Currim (1991), podem ser classificadas de
duas formas, ativas e passivas, sendo que as ativas são consideradas como todo o tipo de
Promoção de Vendas que necessita de uma pesquisa intensiva por parte do cliente para a
conseguir encontrar e usufruir destas, como são exemplo os cupões e passatempos. O tipo
passivo é caracterizado pelas Promoções de Vendas que estão associadas a destaques
promocionais, normalmente está limitado a uma pesquisa dentro do ambiente de loja em
que esses destaques promocionais estão visíveis e não é necessário uma pesquisa
intensiva pelos mesmos (Schneider and Currim 1991).
As Promoções de Vendas são usualmente utilizadas em conjunto com diversas
ferramentas de Marketing para uma eficaz comunicação como mercado-alvo, tal como
são exemplo as ferramentas de comunicação como o Mobile Marketing, Merchandising,
6
Evento, Redes sociais, etc. (Brito 2012). Todas as suas variantes têm um impacto
diferente no comportamento do mercado-alvo, esse comportamento díspar nas tipologias
de Promoção de Vendas é umas das bases deste estudo.
Entre vários estudos comparativos existentes sobre promoções de venda, destaca-
se um estudo sobre dois tipos de Promoções, mais precisamente entre cupões e Produtos
Grátis (Laroche, Pons et al. 2003). Este estudo analisa a perceção do cliente perante
cupões e a oferta de um produto - “dois pelo preço de um” - em que na compra do produto
é oferecida uma segunda unidade. A recolha de dados foi efetuada através de questionário
onde após a análise dos dados se consegue concluir que nos clientes mais conscientes, os
cupões têm uma influência superior. Determinou também que o facto de existir uma
validade nos cupões, influencia os clientes na utilização dos mesmos. No caso do produto
grátis, determinou-se que este teve um impacto superior na perceção dos clientes que tem
mais propensão à compra para stockagem.
Um dos métodos utilizados para criar uma ligação do cliente com o retalhista é o
programa de fidelização do cliente. Na maior parte das vezes, é constituído por um
pequeno objeto de plástico, denominado “cartão”, que permite a criação de um
compromisso entre ambas as partes – cliente e retalhista. Esta ferramenta de fidelização
oferece, na ótica do cliente, um acesso a promoções ou vantagens exclusivas para os seus
detentores, na ótica do retalhista o cartão é algo muito mais importante pois é um
repositório de informação do cliente (Brito 2012). Este programa de fidelização de
clientes tem 6 objetivos principais para o retalhista:
Evitar a fuga de clientes;
Incrementar a quota de despesa do cliente na loja;
Estimular o aumento de consumo;
Tornar os clientes ativistas da marca;
Recolher dados comportamentais sobre o cliente;
Melhorar a rentabilidade.
A informação associada ao cartão é maioritariamente obtida no momento da sua
criação, normalmente são solicitados dados gerais sobre os clientes, tais como nome,
idade, género, contacto eletrónico e/ou telefónico. A obtenção do contacto cria uma ponte
7
de comunicação direta com o cliente, sendo também atribuído um código único
representativo do mesmo. Todas as transações efetuadas pelo cliente com o cartão serão
informação adicional para o repositório de dados do retalhista.
2.2. Segmentação de Mercado
A segmentação de mercado é um conceito que surgiu pela primeira vez por Wendell
Smith (Smith 1956). Sucintamente o autor refere que a segmentação consiste em olhar
para um mercado heterogéneo, em que cada consumidor é caracterizado por uma procura
diferente do outro, como um conjunto de pequenos mercados homogéneos com
necessidades semelhantes.
Num conceito mais recente Wedel e Kamakura (Wedel and Kamakura 2012),
apresentam uma visão sobre a segmentação de mercado um pouco mais abrangente. Estes
autores afirmam que o conceito de repartir o mercado com necessidades heterogéneas em
micros mercados que partilham necessidades, é efetuado com o propósito de elaborar um
plano de ações, com base nos recursos disponíveis do Marketing, para aumentar a
rentabilidade da alocação de recursos efetuada. Estes consideram que a abordagem inicial
ao conceito de segmentação de Mercado proposto por Smith (1956) ainda continua a
manter o seu valor nos dias de hoje.
Por outro lado a segmentação de mercado pode ser efetuada em quatro níveis
diferentes (Kotler and Armstrong 2010):
“Mass Marketing” onde se comunica os mesmos produtos a todos os
consumidores, este nível apresenta a vantagem de ter os custos mais
reduzidos;
“Segment Marketing” que se foca em suprimir as necessidades dos
segmentos do mercado, que torna o mercado mais eficiente;
“Niche Marketing” onde a comunicação se centraliza em subgrupos
dentro de um segmento de mercado (Subsegmento de mercado);
“Micro Marketing”, centraliza-se essencialmente em marketing
individual, um plano de marketing diferente para cada consumidor.
8
Estes quatro níveis estão representados na Figura 1, em que o eixo horizontal
representa o grau de segmentação (Oliveira-Brochado and Martins 2008).
Segundo Kotler e Armstrong (Kotler and Armstrong 2010) para obter uma
segmentação de mercado eficaz, esta tem de corresponder a certos requisitos. Um desses
requisitos é que a segmentação terá de ser Identificável, para que se consiga pelo menos
analisar no mercado a composição e os perfis de consumidores que neles estão presentes.
Outro dos requisitos que a segmentação tem de cumprir é o da Acessibilidade, isto
é, sermos capazes de após efetuar a segmentação, ter acesso aos segmentos criados para
implementar estratégias de Marketing criadas e consequentemente produzirem-se
resultados. Esse mesmo mercado tem de ser Sustentável, isto é a segmentação deve ser
efetuada em mercados em que devido à sua dimensão e respetivo poder de compra as
estratégias de Marketing definidas e aplicadas em cada segmento tragam rentabilidade.
Os últimos requisitos para termos uma segmentação de mercado eficaz é que esta
deve ser Diferenciável e Acionável, ou seja, se dois segmentos criados reagem da mesma
maneira, ou têm as mesmas necessidades, não devem ser dois segmentos, mas sim apenas
um e devem ser passíveis de transmitirem informação suficiente para a deliberação de
ações e instrumentos de Marketing a utilizar especificamente para esses segmentos.
Figura 1 - Graus de Segmentação (Oliveira-Brochado and Martins 2008)
9
2.3. Clustering
Uma das ferramentas mais importantes de Data Mining que é usada nomeadamente
para a segmentação de mercado é o clustering. A essência do clustering é criar grupos
homogéneos em que os seus elementos partilhem as mesmas necessidades ou apresentem
as mesmas características, e que sejam relativamente diferentes dos restantes grupos, a
esses grupos chamamos clusters (Shih, Jheng et al. 2010).
Esta técnica é utilizada em diversas áreas de estudo, como se pode ver nos exemplos
seguintes dados por Boris Mirkin (2012):
Descobrir padrões de pesquisa comuns na Internet;
Organizar documentos em grupos de acordo com o seu conteúdo;
Classificar destinos de férias coma base na atratividade, descobrindo o que cada
um tem de mais atrativo para os “clientes”;
Criar regras para a concessão de crédito.
Para Sarstedt e Mooi (2014) esta técnica deve ser utilizada para segmentar clientes
em estudos de mercado, afirmando que esta ferramenta é menos propensa a criar
subjetividade nas segmentações criadas.
Os objetivos principais do clustering podem resumir-se em cinco, atribuídos por
Boris Mirkin:
1. Estruturação: o principal objetivo que se refere à criação de grupos homogéneos
através da análise de uma base dados;
2. Descrição: o momento em que conseguimos perceber o que cada um representa
com base nas características de cada cluster. Este objetivo é transversal a toda a
análise de clusters pois é parte da sua compreensão e interpretação;
3. Associação: refere a descoberta de inter-relações através da análise das
características de cada cluster;
4. Generalização: podemos tirar algumas conclusões gerais sobre os dados
disponíveis;
5. Visualização: capacidade de representar os clusters como imagens.
10
Boris Mirkin (2012) nos seus estudos define o que podemos denominar - as etapas
do clustering - que envolve tipicamente cinco fases:
1. Desenvolvimento de uma base de dados;
2. Normalização e pré-processamento dos dados;
3. Definição dos clusters nos dados;
4. Interpretação dos clusters;
5. Conclusões.
A primeira etapa caracteriza-se pela definição do problema que pretendemos
analisar, de forma a decidir o conjunto de dados que devemos extrair de uma base de
dados.
A segunda etapa foca-se no pré-processamento de dados, no qual se prepara o
processamento do algoritmo de clustering. A terceira etapa é a descoberta dos clusters
nos dados analisados através de um algoritmo de clustering e nesta etapa conseguimos
delinear o cluster propriamente dito.
A quarta etapa representa a fase em que se analisa a relevância dos resultados
obtidos e se sugere a modificação dos dados, através da adição ou remoção de algumas
variáveis. E por fim temos a última etapa que é onde são feitas as conclusões das
interpretações anteriormente efetuadas e do problema inicialmente definido como ponto
de partida do processo.
De seguida, apresentam-se alguns métodos conhecidos para análise de clusters: o
método hierárquico, com os algoritmos BIRCH e TwostepCluster, e o algoritmo de K-
means
2.3.1. Método Hierárquico
Nesta seção iremos abordar o método hierárquico de segmentação, este método
pode ser divido em duas abordagens (Rokach and Maimon 2005):
Aglomeração – inicialmente cada observação representa um cluster único,
sendo cada uma delas posteriormente aglomeradas entre si até obter a estrutura
de cluster desejada;
11
Divisiva – inicialmente todas as observações pertencem apenas a um cluster,
sendo esse cluster inicial dividido em sub-clusters e assim consecutivamente
até se atingir a estrutura de cluster desejada.
O método hierárquico tem como resultado um dendrograma, representativo da
estrutura de clusters, sendo que a estrutura final de cluster desejada é efetuada através de
um corte no dendrograma no nível de semelhança desejado. Todos os algoritmos
existentes deste método são variantes de três algoritmos (Jain, Murty et al. 1999):
Single-Link Clustering
Complete-Link Clustering
Minimum Variance Clustering
Os algoritmos Single-Link e Complete-Link são os mais populares, uma das
diferenças entre ambos assenta na determinação da distância entre dois clusters, no
primeiro a mesma é caracterizada pela distância mínima entre as duas observações
presentes nos clusters e no segundo a distância entre dois clusters é caracterizada pela
distância máxima entre as observações presente em dois clusters. No que diz respeito à
aglomeração de clusters, ambos os algoritmos tem o mesmo comportamento, realizando
a aglomeração dos dois clusters que apresentarem a menor distância entre si (Jain, Murty
et al. 1999)
As vantagens existentes de uso do Método Hierárquico é a sua versatilidade, pois
tem diversos algoritmos disponíveis para a determinação de clusters. Apresenta também
como vantagem a capacidade de criar múltiplas partições que permite ao seu utilizador a
liberdade de escolha, através do dendrograma resultante do algoritmo. Este método
apresenta também desvantagens, como por exemplo a incapacidade de recuperar o
histórico de ações efetuadas e a inabilidade do uso bases de dados de grandes dimensões.
(Rokach and Maimon 2005)
2.3.1.1. BIRCH
O algoritmo BIRCH foi apresentado pela primeira vez em 1996 (Zhang,
Ramakrishnan et al. 1996). Este demonstra que apesar da sua complexidade, é
12
especialmente indicado para ser utilizado em bases de dados volumosas. Este algoritmo
tem como base da sua operação dois conceitos – Clustering Feature (CF) e CF Tree –
sendo que o primeiro representa a informação de um determinado cluster através da
seguinte expressão: CF=(N, LS, SS) , em que N representa o número de observação no
cluster, LS representa a soma linear de todas as observações presentes no cluster e por
fim a SS que representa a soma dos quadrados das N observações presentes no cluster. O
segundo conceito é o Clustering Feature Tree, um método alternativo de apresentação de
dados, uma árvore com ramificação de fator “B” – número máximo de sub-cluster
possível - e limite “T” – o diâmetro máximo que os sub-clusters podem apresentar.
Este algoritmo está dividido em quatro fases representadas na Figura 2, sendo que
dentro destas quatro fases a segunda e a quarta são de caráter opcional.
A primeira fase representa construção da CF Tree, onde se insere o máximo de
detalhe da informação de cada cluster nos vários nós da árvore. Depois de agrupada a
informação que se encontrava aglomerada em sub-clusters, as observações dispersas são
removidas como outliers.
A segunda fase, tal como foi referido anteriormente é opcional, pois a sua função é
de suporte entre a primeira e a terceira fase. Com as experimentações do algoritmo, pode
existir um gap da dimensão resultante da primeira fase e os resultados que o algoritmo
fornece na terceira fase. Para evitar esse gap é efetuada nesta fase uma redução da árvore
Figura 2 – Fases do algoritmo BIRCH (Zhang, Ramakrishnan et al. 1996)
13
criada inicialmente, para uma mais compacta removendo mais outliers existentes e
agrupando sub-clusters que demonstram maior aglomeração, em sub-clusters de maior
dimensão (Zhang, Ramakrishnan et al. 1996).
Na terceira fase é onde é efetuado o clustering, através da utilização de outros
algoritmos para o agrupamento de sub-clusters, representados pelos seus vetores de CF,
existentes nas ramificações. A quarta e última fase, é também opcional, tendo como
função a melhoria dos resultados obtidos na terceira fase, através do uso dos centros dos
clusters obtidos nesta mesma fase, como sementes para redistribuição das observações
para a semente mais próxima e consequentemente a formação de novos clusters (Zhang,
Ramakrishnan et al. 1996).
2.3.1.2. TwoStep Cluster
O método em análise nesta secção é o TwoStep Cluster iniciado em 2001 (Chiu,
Fang et al. 2001), tal como o próprio nome indica o cluster tem duas fases: uma primeira
semelhante ao método BIRCH, em que são aglomeradas as regiões densas de
observações, e uma segunda fase, o Clustering, com base num modelo hierárquico (Chiu,
Fang et al. 2001).
A primeira fase é caracterizada por se efetuar uma pré-segmentação, isto é, as
observações que se encontram com um grau de aglomeração elevado, são agrupadas entre
si para se tornarem numa única observação, criando pré-clusters que representam regiões
densas de observações, conseguindo deste modo reduzir o número de observações
presentes na amostra. A segunda fase é efetivamente onde se efetua o clustering,
recorrendo a um modelo hierárquico. É efetuada uma aglomeração dos pré-clusters no
número de clusters definido inicialmente.
Uma vantagem deste método é que apresenta face aos restantes a capacidade de
utilizar variáveis quantitativas e qualitativas, ultrapassando as limitações de algoritmos
tradicionais. (Chiu, Fang et al. 2001)
14
2.3.2. K-means
O algoritmo de k-means, é um dos algoritmos de clusters mais populares. Foi
proposto para utilização pela primeira vez em 1956 (Steinhaus 1956).
A simplicidade e a eficiência do algoritmo são algumas umas das razões para a sua
vasta implementação (Jain 2010).
O algoritmo encontra a partição onde o erro quadrático entre a média do cluster e
as observações são minimizadas, sendo o objetivo minimizar o erro quadrático ao longo
de todos os clusters (erro quadrático médio).
O k-means requer a especificação de três parâmetros: o número de clusters, a
inicialização do cluster e a medida de distância; sendo que destes três requisitos a escolha
do número de clusters é a mais importante e complexa, pois ainda não existe nenhuma
fórmula ideal que diga ao analista qual o número correto de clusters a serem escolhidos
para a amostra em análise. Uma das soluções para ultrapassar esta limitação, consiste em
testar o algoritmo para diferentes soluções de clusters e a partição que tiver um maior
relevo para o analista (apresentando um valor reduzido do erro quadrático médio), deverá
ser o valor selecionado (Jain 2010).
O processo de clustering deste algoritmo está assente em quatro passos (Sarstedt
and Mooi 2014), posteriormente executados após a definição do número de clusters
através de tentativas ou por estudos idênticos realizados anteriormente. Com base num
exemplo com duas variáveis, a lealdade à marca e a sensibilidade ao preço, dado por
Sarstedt e Mooi observaremos todas as etapas do processo de clustering. A variável
representada no eixo das ordenadas é a variável da lealdade à marca e no eixo das abcissas
teremos a sensibilidade ao preço.
A primeira etapa do algoritmo passa por definir aleatoriamente o centro de cada
cluster como representa a Figura 3, onde é definido o centro do cluster 1 (CC1) e o centro
de cluster 2 (CC2).
15
Figura 3 - 1º passo K-means (Sarstedt and Mooi 2014)
Após este passo, são calculadas as distâncias de cada objeto para cada centro de
cluster definido e cada objeto fica atribuído ao cluster que apresenta a menor distancia
para o seu centro, como é representado na Figura 4.
Figura 4 - 2º passo K-means (Sarstedt and Mooi 2014)
Finalizada a partição inicial de clusters, é calculado o novo centro geométrico de
cluster (CC1’ e CC2’), efetuado através do cálculo das médias das variáveis de cada
objeto.
16
Figura 5 - 3º passo K-means (Sarstedt and Mooi 2014)
Por fim, como último passo, as distâncias para o novo centro de cluster são
novamente calculadas, à semelhança do 2º passo em que os objetos são atribuídos a cada
cluster com base na distância que apresentam para os novos centros de clusters.
Figura 6 - 4º passo K-means (Sarstedt and Mooi 2014)
Seguidamente, os passos 3 e 4 são repetidos até atingir o número de iterações
definidas inicialmente ou até não haver alterações nos centros de clusters.
17
A vantagem da utilização deste algoritmo face aos hierárquicos é a capacidade de
uma observação alterar de cluster com o decorrer do processo de clustering. Este
algoritmo será o escolhido para este estudo devido à simplicidade no processamento de
grandes bases de dados, permitindo uma rápida e eficiente análise dos resultados (Sarstedt
and Mooi 2014)
2.4. Análise RFM
A utilização da análise RFM é bastante popular em Marketing, devido à sua
simplicidade e performance na obtenção de resultados, combinando o Clustering com os
resultados da análise RFM consegue-se produzir um maior conhecimento sobre o
comportamento do consumidor do que qualquer outra análise de clusters (Birant 2011).
O conceito de Análise RFM foi introduzido por Bult e Wansbeek (1995), e consiste
num uso sistemático das variáveis de Recência (R); Frequência (F) e Monetarização (M).
A variável Recência mede o fator tempo desde a última compra de cada consumidor
até a data em que se efetua a análise. A variável Frequência mede o número de vezes em
que cada consumidor efetua uma transação durante o período em análise e por fim a
variável Monetarização analisa o valor total despendido por cada consumidor no
somatório de todas as transações efetuadas dentro do período de tempo analisado
(Hosseini, Maleki et al. 2010).
A análise RFM pode apresentar vários significados para os seus utilizadores. A
implementação clássica desta análise, consiste em atribuir uma classificação em cada uma
das variáveis com base na comparação de todos os consumidores presentes na amostra,
sendo por fim atribuída uma classificação RFM para cada consumidor. O seu principal
objetivo é identificar os segmentos de clientes que apresentem uma maior probabilidade
de resposta positiva a uma campanha de Marketing (Coussement, Van den Bossche et al.
2014). Ao conseguir definir os segmentos de consumidores em que as campanhas têm
maior eficácia evita-se o desperdício de recursos em clientes que não iriam responder.
A análise RFM foi utilizada ao longo dos anos em diversas áreas: desde o sistema
bancário e Seguradoras (Hsieh 2004); Agências governamentais; Empresas Online e de
telecomunicações; Agências de Viagens (Wei, Lin et al. 2010) e Industria Automóvel
(Birant 2011).
18
Sohrabi e Khanlari (2007) utilizam a análise RFM como um método para
determinar o Customer Lifetime Value (CLV). O CLV é definido pela soma de todas as
receitas obtidas para a Empresa da totalidade do consumo de um cliente, liquidado de
todos os gastos que a Empresa teve em atrair o seu consumo. Esta análise é utilizada neste
cálculo do valor CLV, devido às variáveis utilizadas na mesma serem mais eficazes em
separar os clientes que são comportamentalmente mais leais, dos clientes que têm maior
tendência em deixar de consumir na Empresa (Buckinx and Van den Poel 2005).
Um outro estudo realizado por Jonker (Jonker, Piersma et al. 2004), desenvolveu
uma pequena mutação no que conhecemos da análise RFM, esta apesar de ter algumas
limitações, como por exemplo só permitir efetuar a análise com dados com um período
temporal superior a 2 anos, conseguiu mostrar que é identicamente fiável como o Modelo
CHAID, um modelo que determina a melhor estratégia a aplicar sobre um segmento (Kass
1980).
19
3. Metodologia e Dados
O presente capítulo tem como intuito clarificar a metodologia a utilizar nesta
dissertação, bem como descrever os dados utilizados. Com este estudo pretende-se
realizar uma segmentação do mercado do retalho desportivo em Portugal através de uma
Análise RFM pelas diferentes categorias de desportos e posteriormente efetuar uma
segmentação de mercado recorrendo ao algoritmo de clustering K-means, realizando
campanhas com diferentes tipologias promocionais no cluster definido como o de clientes
perdidos.
3.1. Objetivo do estudo
Este estudo tem como objetivo definir qual a tipologia promocional mais eficiente
na atração de clientes perdidos à loja, através da análise de campanhas efetuadas junto do
cluster selecionado.
A análise de resultados vai ser efetuada em quatro bases distintas – taxa de
conversão, vendas líquidas, ticket médio e rentabilidade. A combinação da análise da
eficiência de cada tipologia promocional, por categoria, dentro destas quatro bases
permitirá atingir o objetivo final de concluir qual a tipologia promocional mais eficiente
na atração de clientes.
Um resultado importante deste estudo é poder mostrar que as campanhas efetuadas,
no cluster de clientes perdidos, conseguem trazer rentabilidade à Empresa. O benefício
em margem que advém das compras efetuadas pelos clientes abrangidos pelas
campanhas, tem de ser superior aos custos totais da implementação das mesmas.
3.2. Método de estudo
Nesta dissertação utiliza-se o Estudo de Caso com o objetivo de definir a melhor
tipologia promocional em cada categoriade desporto, em que se recorre à utilização da
análise RFM para atribuir classificações aos clientes na base dados, com base em três
variáveis, a data da sua ultima compra, frequência de compra e valor total gasto (Hosseini,
20
Maleki et al. 2010). Com a classificação de cada cliente disponível, efetua-se uma
segmentação dos mesmos, recorrendo ao algoritmo de k-means para obtenção de clusters.
Um fator que levou à escolha do algoritmo de k-means prendeu-se com a sua simplicidade
no processamento de grandes bases de dados.
Após a definição dos clusters, será selecionado o cluster que representa os clientes
perdidos. Será neste cluster que serão efetuadas campanhas com duas tipologias
promocionais diferentes, uma em valor e outra em percentagem. Contudo, a ideia é que
haja nestas campanhas uma perceção de benefício para o cliente idêntico entre ambas,
para se poder concluir posteriormente sobre qual a tipologia promocional mais eficiente.
3.3. Definição da População e Amostra
A população deste estudo é constituída por todos os clientes com cartão fidelização
de uma Empresa do mercado de retalho desportivo com dados de transação desde o início
do ano 2014 até ao mês de fevereiro de 2017, facultados pela própria Empresa. A amostra
a utilizar coincide com a base de amostragem e é composta por 533649 cartões de
fidelização. Estes cartões realizaram 1048576 transações efetuadas que se encontra
dividida em sete unidades de negócio (ver Figura 7) de onde, posteriormente serão
definidas algumas categorias para análise.
Figura 7 - As 7 Unidades de negócio
21 - FUTEBOL13%
22 - COLETIVOS E OUTROS
7%
23 - FITNESS E ESSENTIALS
22%
24 - RUNNING14%
25 - AQUÁTICOS E SKATES
2%
26 - CASUAL30%
27 - OUTDOOR12%
21
A escolha destas categorias por parte do autor, procura englobar diferentes
tipologias de artigo. Devido a limitações do plano promocional dentro da Empresa onde
o estudo é realizado, apenas será possível a implementação em três categorias,
representadas abaixo com o respetivo peso de Vendas Líquidas dentro da sua unidade de
negócio.
Futebol Calçado (41% de peso nas Vendas Líquidas)
Têxtil Fitness (15% de peso nas Vendas Líquidas)
Calçado Running (67% de peso nas Vendas Líquidas)
A escolha destas três categorias assentou numa ótica de estratégia interna da
Empresa sendo que, estas tinham sido definidas como basilares no futuro do negócio da
Empresa em questão.
3.4. Variáveis de Estudo
A base de dados, disponibilizada para o estudo, tem disponível para análise as
seguintes variáveis:
Nº de Cliente – “ID_cliente”
Gênero
Idade
Total de Vendas Brutas – “VB”
Nº de Transações – “NTRANS”
Data da última Compra – “Data”
Categoria
As três categorias escolhidas na seção anterior têm por objetivo englobar as
tipologias de Calçado e Têxtil em diferentes desportos. Todas estas categorias vão
22
submeter-se ao mesmo processo de forma a ser possível analisar a sensibilidade dos
clientes às diferentes tipologias de campanha nos diferentes tipos de artigo.
O processo que será transversal às três categorias irá iniciar-se com uma análise
RFM, uma técnica de Marketing Direto que nos vai permitir agrupar cada cliente com
base nas três características analisadas - a “Recência”, a “Frequência” e o “Valor
Monetário” – a primeira característica representa a data da última compra efetuada, a
Frequência representa o número de transações de cada cliente, e o Valor Monetário é o
valor total de vendas efetuadas ao cliente (Hosseini, Maleki et al. 2010). Esta análise tem
a possibilidade de gerar entre 2 a 9 agrupamentos por característica (Coussement, Van
den Bossche et al. 2014).
Neste estudo o autor utilizará cerca de 5 agrupamentos em cada característica. Este
agrupamento poderá ser efetuado segundo dois métodos: o Método “Nested” e o Método
“Independent”. O método “Nested”, classifica inicialmente de 1 a 5 por cada cliente pela
sua “Recência”, em seguida dentro dos 5 grupos já criados agrupar-se-ão em cada um
deles os clientes com base na “Frequência”, e por fim em cada conjunto criado de
“Recência” e “Frequência” agrupar-se-á cada cliente com base no seu “Valor
Monetário”. O método “Independent” classifica cada cliente de 1 a 5 cada variável
independentemente da classificação nas outras.
O método selecionado será o método “Nested” pois neste estudo a variável
Recência é uma peça fundamental para a seleção de clientes e como tal é mais importante
perceber por cada classificação da variável Recência quais são os clientes mais frequentes
e valiosos. Terminada esta fase será possível identificar em que agrupamento se encontra
o cliente relativo a cada característica, sendo atribuída uma classificação RFM a cada
indivíduo que resulta da concatenação das classificações “Recência”, “Frequência” e
“Valor Monetário”. Quanto maior for o “valor” de cada característica, melhor será a sua
performance, isto é quanto maior o “valor” atual, mais frequente ou mais valioso será.
23
4. Definição dos Clusters
Definida a metodologia a aplicar e os objetivos a atingir, neste capítulo detalhar-se-
á todo o processo aplicado desde a segmentação de clientes, com a determinação dos
clusters recorrendo aos algoritmos de k-means, e à identificação do cluster onde se
realizarão as campanhas promocionais de onde se obterá os resultados para análise.
4.1. Segmentação de clientes e estruturação da campanha
A segmentação dos clientes será feita recorrendo, ao algoritmo de k-means, em que
as variáveis a definir para análise e posterior estruturação dos clusters serão os resultados
obtidos na Análise RFM. A segmentação através da analise clusters permitirá encontrar
grupos de pessoas com as mesmas necessidades, e para tal existem vários algoritmos que
possibilitam a obtenção desses clusters. Neste estudo utilizar-se-á o algoritmo de k-means
devido à simplicidade no processamento de grandes bases de dados e objetividade do seu
processo para a obtenção de resultados.
A decisão sobre o número de clusters a definir pode ser efetuada pelo elbow method,
este método afirma que o número de clusters eficaz é aquele que ao adicionar mais um
cluster, não é adicionada informação suficiente. Mais precisamente significa que ao
efetuarmos o gráfico entre a percentagem da variância explicada no eixo das ordenadas e
o número de clusters no eixo das abcissas, o ponto onde o ganho marginal da variância
diminui, gerando um ângulo no gráfico, será o número de cluster escolhido (Thorndike
1953).
Foi utilizado o programa SPSS (Statistical Package for the Social Sciences), para a
análise de clusters. O autor definiu o número de clusters, a utilizar no algoritmo de k-
means, em cinco uma vez que sempre que o número de clusters aumenta, surge um cluster
praticamente idêntico a um já existente. Por essa razão ao manterem-se os cinco clusters
para as três categorias em análise, o resultado obtido são clusters com diferenciação
assumida entre eles.
Após a definição dos clusters finais, o autor atuará sobre aquele que considera o
cluster onde existem os clientes perdidos, ou seja, o cluster em que o seu centro final
24
tenha uma baixa classificação na característica “Recência”. Nos casos em que se obtém
o mesmo valor de “Recência” no Centro final de dois ou mais clusters optar-se-á pelo
que tiver um valor mais elevado na variável “Valor Monetário”, caso as duas variáveis
anteriores sejam iguais o autor escolherá o cluster que tiver no centro final um valor mais
elevado da variável “Frequência”.
Definido o cluster onde atuar, iniciar-se-á a fase das campanhas segmentadas, que
terão por base duas tipologias: uma em que são oferecidos 5€ em cartão numa compra
superior a 25€, isto é, é atribuído um valor fixo em cartão de fidelização,
independentemente do valor de compras efetuado, desde que a mesma seja superior a um
valor em euros previamente definido. A segunda irá oferecer o desconto percentual de
20% na próxima transação, esse valor irá acumular em cartão, sendo possível desconta-
lo numa transação futura. Nestas campanhas (serão curtas no espaço temporal) o cliente
recebe a comunicação da campanha via SMS numa quinta-feira e terá cerca de 7 dias para
usufruir da mesma e em ambas os clientes que usufruírem destas só as poderão
transacionar através de um código promocional enviado por SMS e na apresentação do
seu cartão de fidelização.
Devido a limitação de custos de implementação das campanhas, cada uma estará
limitada a 6000 clientes por categoria, 3000 para a campanha promocional em Valor e
3000 para a campanha promocional em percentagem. Serão acrescentados mais 2000
clientes, 1000 por cada tipologia de campanha, para se criar o grupo de controlo. Este
grupo tem como objetivo perceber também a variação da sazonalidade de consumo do
cluster. No final teremos de selecionar, do cluster definido como o de “clientes perdidos”,
um total de 8000 clientes para o estudo.
Os 8000 clientes a selecionar para serem abrangidos pelas tipologias promocionais,
serão os que são considerados para a Empresa como os mais “valiosos”, ou seja são
aqueles que apresentam uma classificação superior na variável “Valor Monetário”. Para
atingir esse objetivo o autor definiu uma nova classificação com base no inverso da
classificação RFM, entenda-se este novo resultado como a classificação “MFR”, a
concatenação da classificação de cada cliente do “Valor Monetário”, seguido da
“Frequência” e por fim “Recência”, isto permite definir que os clientes com uma maior
classificação, sejam aqueles que mais valor trouxeram à Empresa em compras efetuadas
25
em tempos passados, e assim dentro do cluster definido como o de clientes perdidos,
atingir-se-á os clientes que trouxeram mais valor para a Empresa.
No caso em que o mesmo cliente existe duplicado em duas ou mais categorias, o
critério de seleção será o mesmo efetuado na seleção dos 8000 clientes - a Classificação
MFR - ou seja a categoria onde o cliente apresentar uma classificação superior será a
categoria onde estará abrangido. No caso de o cliente obter a mesma classificação MFR,
o critério de seleção será a categoria em que o cliente apresenta o ticket médio superior.
Para definir em que clientes irão incidir estas campanhas o autor divide em duas
partes iguais os clientes em que decide atuar, sendo que numas dessas partes a campanha
é comunicada com desconto em valor e na segunda parte com desconto em percentagem.
Essa divisão é efetuada através do valor de Ticket Médio de cada cliente. Por Ticket
Médio entenda-se o valor médio por transação de cada cliente obtido através da divisão
do valor das Vendas Brutas pelo número de transações efetuadas. Os 4000 clientes com
o Ticket Médio superior são abrangidos pelas campanhas de Desconto em percentagem,
sendo que os restantes 4000 recebem as campanhas de desconto em Valor.
Dos 4000 clientes definidos para cada tipologia promocional, serão selecionados
aleatoriamente 1000 clientes para pertencerem ao grupo de controlo, que representará
cerca de 25% a amostra e não estarão abrangidos por nenhuma tipologia promocional.
De modo a atingir ao objetivo final - perceber a sensibilidade de cada tipologia de
campanha em cada categoria – será medida a taxa de conversão, as Vendas Líquidas, a
Margem e o Ticket médio, em cada umas das partes. Por taxa de conversão entende-se a
percentagem de clientes que foram à loja, após receberem o SMS promocional, para
efetuarem uma compra, sendo que onde a taxa for superior ao grupo de controlo, podemos
concluir que a tipologia de campanha é a mais eficaz na categoria. A Taxa de Conversão
poderá futuramente ser ainda medida uma segunda vez, tendo em conta que uma das
partes dos elementos do cluster escolhido, ao efetuar a transação dentro do período da
campanha vai ainda acumular valor em cartão que pode usufruir numa compra futura. Aí
será possível medir qual a percentagem de clientes que voltou uma 2ª vez à loja para
efetuar uma compra e descontar o valor acumulado no seu cartão de fidelização.
Uma das formas de despistar algumas variações normais de consumo que possam
existir, será criar um grupo de controlo dentro do cluster onde se pretende atuar, de cerca
de 25% dos clientes, onde não será lançada nenhuma campanha, e posteriormente
26
analisar-se-á a variação de consumo desse grupo durante o momento de campanhas
segmentadas, com o objetivo de compreender se dentro da categoria existiu alguma
variação relativa ao consumo, evitando assim interpretações erradas de resultados.
O foco principal de todas as cadeias de retalho é a rentabilidade e este não pode ser
diferente nas campanhas segmentadas, mas este ponto terá de ser visto não só como um
acréscimo de rentabilidade, mas sim como um acréscimo de vendas, pois a finalidade é
reativar clientes perdidos.
4.2. Comunicação com os clientes
Neste ponto o autor irá explicar como será efetuada a comunicação das campanhas
aos clientes. Esta será efetuada via SMS, sendo que no total foram enviadas 12000 SMS
divididas em 4 grupos iguais (3000 SMS por grupo) por tipologia de campanha/categoria,
estas mensagens foram enviadas através do serviço disponibilizado pela Empresa. Este
processo é também limitado pelos 160 carateres que apenas é possível utilizar para
comunicar ao cliente, sendo que existe sempre necessidade de incluir um código
promocional de 8 dígitos e conseguir ser o mais esclarecedora possível.
A limitação de Caracteres implica a utilização de algumas abreviaturas de forma a
não ultrapassar os 160 caracteres. Nas SMS enviadas é obrigatório o envio de algumas
expressões que condicionam a campanha, como no caso de as campanhas não serem
acumuláveis com outras em vigor utilizando a expressão: “N/ Acumuláveis”, e que os
códigos promocionais não possam ser utilizados em outlets através da frase: “S/ Outlets”.
A duração da campanha terá também de ser referida na SMS, sendo que a mesma é
enviada no primeiro dia em vigor da campanha, e é apenas necessário referir o último dia
em que se encontra em vigor através de “Valido até DD/MM”. Os restantes caracteres
têm de ser utilizados para transmitir uma mensagem clara e direta aos clientes.
O texto enviado via SMS para os clientes que recebem as campanhas em valor,
diferenciando apenas o nome da categoria em que se está a realizar a campanha, é o
seguinte:
27
“Acumula 5€ em cartão numa compra de Calçado Futebol em compras sup. a 25€.
Valido até 21/06. N/ acumulável. S/ Outlets. Codigo: 185XXXXX”
Os clientes abrangidos pelas campanhas em cartão recebem o texto via SMS,
apresentado abaixo, e tal como na SMS anterior apenas sofre variações no texto, no que
se refere ao nome da categoria.
“Aproveita Já! 20% Desconto em cartão na próxima compra de Calçado Futebol
até 21 de junho. N/ acumulável. S/ Outlets. Codigo: 185XXXXX”
4.3. Identificação do cluster a observar
Nesta secção apresentar-se-á todos os passos até à implementação das campanhas,
detalhando todos os passos efetuados em SPSS até obtenção dos clusters com o intuito
de se conseguir posteriormente efetuar a análise dos resultados obtidos das campanhas
em vigor.
O primeiro passo será o de efetuar a análise RFM para cada uma das categorias
escolhidas para o estudo. As três categorias selecionadas pelo autor para o estudo foram
Calçado Futebol, Têxtil Fitness e Calçado Running.
Da base de dados disponibilizada ao autor para o estudo utilizar-se-á a variável
“ID_Cliente” como identificador do cliente, que representa o número de Cartão de
fidelização do cliente, a variável “VB” representativa das Vendas Brutas como
identificador do valor total transacionado pelo cliente e a Variável “NTRANS” para
identificar o número de transações de cada cliente. Por fim o autor usa a Variável “Data”
como identificadora da data em que o cliente efetuou a ultima transação.
28
No separador ”Binning”, visualmente representado na Figura 9, é definido o
método de agrupamento de cada cliente, tal como foi referido na metodologia será
utilizado o Método “Nested”. O autor define cerca de 5 agrupamentos de clientes em cada
característica RFM.
Figura 8 - Análise RFM – Seperador Variables
Figura 9 - Análise RFM -Separador Binning
29
Por fim no separador “Output” é possível definir que informação se quer extrair,
seja já com os clientes agrupados como é exemplo um gráfico de contagens por
agrupamento ou é possível a extração de informação não agrupada, como é o caso de
histogramas.
Este Processo será repetido pelas três categorias, no final terminados todos estes
passos, obter-se-á uma nova base de dados onde são acrescentadas quatro novas variáveis
– “Recency_Score”, “Frequency_score”, “Monetary Score” e “RFM_score”-
representativas da classificação de cada uma das características (Figura 11).
Figura 11 - Análise RFM – Base de dados
Figura 10 - Análise RFM – Separador Output
30
Terminada a análise RFM das três categorias em estudo, avançar-se-á agora para a
segmentação de cada uma delas através do algoritmo k-means,
O primeiro passo do algoritmo, prende-se com a definição das variáveis que se
pretende analisar na segmentação. Tal como foi referido anteriormente as variáveis a
utilizar serão as resultantes da Análise RFM, isto é, é utilizada a classificação obtida da
”Recência”, “Frequência” e “Valor Monetário” (“Recency_Score”, “Frequency_score”,
“Monetary Score”), sendo que o identificador do cliente será a variável “”ID_Cliente”
conforme podemos observar na Figura 12.
O número de clusters a determinar, tal como definidos inicialmente serão 5e com
um número máximo de iterações de 10.
A primeira categoria em análise será Calçado Futebol, onde será aplicado o
algoritmo com as condições definidas anteriormente.
Os centros iniciais de clusters são atribuídos aleatoriamente sendo posteriormente
efetuadas iterações de ajustes nos centros de clusters até que não sofram mais alterações.
Figura 12 - Algoritmo k-means
31
Como podemos observar na Tabela 1, bastaram apenas 4 iterações do algoritmo para que
os centros de clusters convergissem até às suas posições finais, sendo que o cluster II
atingiu a sua posição final à segunda iteração e o cluster III, necessitou apenas de três
iterações para atingir a sua posição final.
Na Tabela 2, comparamos as posições centrais dos clusters no início e fim do
processo de algoritmo, como podemos ver todos os clusters sofreram alterações mínimas
nos respetivos centros. O cluster II foi o único que alterou a sua posição central em duas
das variáveis do algoritmo.
Na Tabela 3 verifica-se o detalhe do número de clientes por cluster de onde, com
base nos centros finais de cluster obtidos através do algoritmo de k-means (Tabela 2),
Cluster Inicial Final Inicial Final Inicial Final
I 5 5 4 3 4 4
II 1 2 5 4 4 4
III 2 2 5 4 1 1
IV 2 2 2 2 5 4
V 4 4 2 2 1 2
Recency score Frequency score Monetary score
I 24417
II 11795
III 13629
IV 26003
V 32021
107865
Cluster
Total
I II III IV V
1 ,895 1,110 1,114 ,822 ,762
2 ,183 0,000 ,172 ,200 ,057
3 ,100 0,000 0,000 ,131 ,095
4 0,000 0,000 0,000 0,000 0,000
IterationChange in Cluster Centers
Tabela 1 - Histórico de Iterações em Calçado Futebol
Tabela 2 - Centros de Clusters Iniciais e Finais de Calçado Futebol
Tabela 3 - Clientes por Cluster Calçado Futebol
32
selecionar-se-á o cluster em que se irá efetuar as campanhas. Ao seguir o critério definido
anteriormente de seleção de clusters, o cluster onde incidirá o estudo será o cluster II,
onde se encontram os Clientes Perdidos, que representam um valor para a Empresa e uma
elevada frequência de visita. O cluster II tem cerca de 11795 clientes todos ele com uma
data desde a última compra na Empresa superior a um ano, de onde se selecionará com
base nos critérios definidos no Capítulo da Metodologia, os 8000 clientes que serão
separados, seguindo as bases definidas anteriormente, para efetuar as duas tipologias de
campanha.
Na segunda categoria em análise (Têxtil Fitness), foram necessárias sete iterações
(Tabela 4) para os clusters convergirem para as suas posições finais, sendo que o cluster
II foi o único que teve movimentações até ser efetuada a última iteração. Os clusters IV
e V são os únicos que apresentam respetivamente apenas três e quatro movimentações,
mas em iterações não sequenciais, o que indica que os mesmos após terem definido uma
posição fixa a partir da terceira iteração, foram obrigados a ajustar fruto dos movimentos
existentes nos clusters II e III.
Na Tabela 5, observamos a comparação entre as posições centrais de clusters nas
três variáveis utilizadas no algoritmo. A variável Recência, mostrou ser a que se
I II III IV V
1 1,397 ,438 ,981 1,005 ,853
2 ,077 ,179 ,155 0,000 ,200
3 0,000 ,062 ,078 0,000 0,000
4 0,000 ,067 ,085 0,000 0,000
5 0,000 ,078 ,062 0,000 ,100
6 0,000 ,147 0,000 ,129 ,129
7 0,000 0,000 0,000 0,000 0,000
Iteration History
IterationChange in Cluster Centers
Tabela 4 - Histórico de Iterações em Têxtil Fitness
33
movimentou mais, pois alterou a sua posição inicial até ao final do processo em três
clusters, enquanto as restantes variáveis apenas alteraram o seu centro em dois clusters.
Na Tabela 6 podemos ver o número de clientes por cluster e conforme o critério
que está definido para a seleção do mesmo na realização das campanhas, o estudo vai
incidir sobre o cluster I, que representa os Clientes Perdidos e que conta com 40415
clientes, dos quais se irão apenas selecionar 8000 clientes, com base nos critérios
definidos anteriormente, sendo que 25% desse número é para o grupo de controlo e cerca
de 3000 para a campanha em valor e 3000 para a campanha em percentagem. Todos os
clientes presentes no cluster selecionado não têm compra no último ano em qualquer
categoria da Empresa.
A última categoria em análise é Calçado Running, onde se efetuará o mesmo
processo das categorias anteriores, usando o algoritmo de k-means. Foram necessárias
apenas três iterações do algoritmo para que os centros de clusters convergissem até à sua
posição final. Esta foi a categoria que necessitou de menos iterações, sendo que o cluster
III e IV, à segunda iteração tinham encontrado a sua posição final (Tabela 7).
Cluster Inicial Final Inicial Final Inicial Final
I 1 2 2 2 5 4
II 3 3 5 5 3 3
III 1 2 2 3 1 1
IV 5 5 2 2 5 4
V 5 4 2 3 1 1
Recency score Frequency score Monetary score
I 40415
II 37219
III 30431
IV 21182
V 22914
152161
Cluster
Total
Tabela 5 - Centros Cluster Iniciais e Finais em Têxtil Fitness
Tabela 6 - Clientes por Cluster Têxtil Fitness
34
Na Tabela 8, observamos as diferenças entre as posições inicias dos clusters e os
seus centros finais. A variável Valor Monetário, foi a única que alterou o seu centro em
três clusters, tendo a variável da Recência sofrido alteração em um cluster e a variável
Frequência sofrido apenas alteração do centro inicial para o centro final no Cluster III.
No comportamento do cluster V destaca-se pois, apesar de ter sofrido movimentos
nas iterações os seus centros finais mantêm-se idênticos aos iniciais.
Na Tabela 9, vemos o resultado de todo o processo que culmina com a distribuição
de clientes por cluster.
Tendo em conta os critérios explicitados no capítulo 3 o cluster V, representado
pelos clientes perdidos, é o utilizado para selecionar os 8000 clientes para distribuir pelo
Cluster Inicial Final Inicial Final Inicial Final
I 5 4 2 2 5 4
II 5 4 5 5 3 3
III 1 1 5 4 1 2
IV 4 4 2 2 1 2
V 1 1 2 2 4 4
Monetary scoreRecency score Frequency score
I II III IV V
1 ,949 1,095 1,271 ,986 ,659
2 ,180 ,162 0,000 0,000 ,213
3 0,000 0,000 0,000 0,000 0,000
IterationChange in Cluster Centers
I 36107
II 26503
III 18537
IV 56905
V 40420
178472Total
Cluster
Tabela 7 - Histórico de Iterações de Calçado Running
Tabela 8 - Centros Cluster Iniciais e Finais Calçado Running
Tabela 9 - Clientes por Cluster Calçado Running
35
grupo de controlo e pelas campanhas a realizar. Estes clientes selecionados para o estudo
tal como nas categorias anteriores não efetuam nenhuma compra na Empresa há pelo
menos 1 ano.
36
5. Análise dos Resultados das campanhas
Neste Capítulo são analisados os resultados obtidos das campanhas efetuadas para
posteriormente, se obterem as conclusões finais do estudo.
Esta análise encontra-se dividida em quatro variáveis – Taxa de Conversão, Vendas
Líquidas, Ticket Médio e Rentabilidade – que serão analisadas por Categoria e
posteriormente numa ótica geral da Empresa.
Um dos objetivos principais é que o estudo desenvolvido traga rentabilidade para a
Empresa, para tal terão de ser suportados todos os custos inerentes as campanhas. Estes
custos resumem-se apenas ao envio das SMS aos clientes - custo por SMS de 0.017€ -
sendo que foram enviados 12000 SMS, perfazendo um custo total de 204€.
5.1. Taxas de Conversão
Nesta secção analisar-se-á o número de transações existentes por tipologia de
campanha dentro de cada categoria e dentro da Empresa.
No Gráfico 1, está representada a Taxa de Conversão, ou seja, a percentagem dos
3000 clientes que receberam a SMS referentes a uma das tipologias promocionais, e que
dentro do prazo estipulado de cada campanha efetuaram uma transação na categoria em
questão.
As campanhas efetuadas neste estudo estão identificadas por:
"Nome da categoria_20pct" - para os clientes que receberam 20% de
desconto;
"Nome da categora_5eu" - para as campanhas referentes aos clientes que
recebiam 5€ em transações superiores a 25€.
37
As taxas de conversão em transações por categoria e tipologia de campanha,
revelaram-se um pouco baixas, contudo superiores às apresentadas no grupo de controlo,
com exceção da campanha de 20% em cartão em Calçado Futebol e a campanha de 5€
em Têxtil Fitness. Estes resultados demonstram que mesmo com a pouca adesão, este tipo
de SMS promocionais surtem um efeito positivo na atratividade do cliente para compras
na categoria.
De seguida serão analisadas estas taxas de transação a um nível geral (Gráfico 2),
isto é, trata-se de medir clientes que recebem mensagem de uma campanha numa
determinada categoria e não efetuaram transações nessa categoria, mas sim na restante
loja.
Gráfico 1 - Taxa de conversão à categoria
38
Neste caso as taxas de conversão, apresentam resultados um pouco diferentes das
taxas na categoria, sendo que apenas metade das campanhas – 5€ em Calçado Futebol,
20% em Têxtil Fitness e 5€ em Têxtil Fitness - apresentam uma taxa superior à do grupo
de controlo.
Se olharmos para as duas taxas de conversão em conjunto, verifica-se que houve
um fluxo normal de clientes à loja, clientes esses que estão abrangidos pela campanha de
20% em Calçado Futebol. Estes representam os clientes que historicamente apresentam
o ticket médio superior, ou seja, praticam uma compra mais racional.
O período da campanha em finais de julho é para muitos uma transição na época
desportiva, que conduz a uma “renovação” de todo o equipamento desportivo, essa será
uma das justificações para as diferenças apresentadas face ao grupo de controlo.
No caso das campanhas efetuadas em Calçado Running verificamos um
comportamento diferente nas duas taxas de conversão. A Taxa à categoria apresenta-se
bastante inferior em ambas as campanhas, no que diz respeito à taxa Geral da Empresa,
verifica-se que a mesma é superior. Este resultado pode ser explicado pelo facto de grande
parte dos clientes perdidos da categoria em questão, possivelmente só efetuem compras
de Calçado Running quando têm alguma vantagem promocional associada.
Gráfico 2 – Taxa de conversão na Empresa
39
Numa visão global as taxas de resposta mostraram-se muito elevadas na visão de
transações gerais na Empresa, tanto do Grupo de Controlo como das Campanhas
efetuadas, tendo em conta que estes clientes não efetuavam compras na Empresa à pelo
menos um ano. Este repentino acréscimo de retorno de clientes pode estar relacionado
com o crescimento do índice de confiança do consumidor, que no mês de junho atingiu o
valor mais alto do Seculo XXI, segundo dados do Banco de Portugal. Outro fator que
pode ter potenciado o regresso dos clientes são as condições climatéricas, o período
homólogo em que se realizaram as campanhas não foi caracterizado por temperaturas tão
elevadas. Historicamente este fator esta relacionado com um maior número de transações
na Empresa.
Como conclusão destes resultados conseguimos ter uma primeira indicação da
tipologia de campanha mais eficiente em cada categoria. No caso de Calçado Futebol
conseguimos perceber que a comunicação tipologia percentual foi mais eficiente, nas
duas taxas de conversão em análise.
Na categoria Têxtil Fitness verifica-se um comportamento diferente nas duas taxas
de conversão, no caso da taxa de conversão à categoria foi mais eficiente a comunicação
de percentagem e no caso da taxa de conversão geral vemos que a comunicação
promocional de 5€ foi mais eficiente, apesar do diferencial entre ambos ser mínimo.
Por fim observa-se um comportamento diferente na categoria de Calçado de
Running em que, em ambas as taxas de transação, a comunicação promocional em que se
oferecia um desconto fixo em euros numa compra superior a um valor previamente
determinado, foi a mais eficiente sempre por um pequeno diferencial.
5.2. Vendas Líquidas
As vendas Líquidas são um fator importante nos resultados de todas as Empresas
retalhistas, e é precisamente o que será analisado nesta secção. Por Vendas Líquidas
entende-se todas as vendas efetuadas a Preço de Venda ao Publico sobre o qual
posteriormente é retirado o valor do IVA (Imposto de Valor Acrescentado).
Tal como foi efetuado no subcapítulo anterior dividir-se-á em duas análises: uma à
Categoria e uma outra a nível geral da Empresa.
40
No Gráfico 3 temos representado o volume de vendas líquidas na categoria, dos
clientes que foram abrangidos pela campanha, bem como do Grupo de controlo.
A Tabela 10 tem o percentual de Vendas Líquidas dos clientes abrangidos pela
campanha e do grupo de controlo, no total consumido por ambos os grupos.
Nos resultados apresentados verifica-se um grande consumo na categoria de
Calçado Running versus o grupo de controlo. De ambas as tipologias de campanha, tendo
em conta que os 75% de clientes que receberam o SMS tiveram um percentual de gasto
em vendas na Categoria muito superior à percentagem que representam, a que teve mais
sucesso foi a comunicação da tipologia de desconto em euros.
No caso das campanhas efetuadas em Têxtil Fitness, o resultado foi totalmente
diferente, observa-se em ambas as tipologias de campanha resultados menos positivos em
Gráfico 3 – Vendas liquídas na Categoria
Campanha G. Controlo
Calçado Fut_20pct 57% 43%
Calçado Fut_5eu 90% 10%
Textil Fit_20pct 73% 27%
Textil Fit_5eu 69% 31%
Calçado Run_20pct 88% 12%
Calçado Run_5eu 100% 0%
Tabela 10 - Percentagem de Consumo na Categoria
41
que o grupo de controlo teve uma percentagem de consumo superior à sua
representatividade na amostra (25%). Entre as duas campanhas a que se destaca mais
eficiente é a campanha com a tipologia de desconto percentual.
A categoria de Calçado Futebol apresenta dois comportamentos totalmente
diferentes, na tipologia de campanha com desconto em percentual, os 25% de clientes
pertencentes ao grupo de controlo representa um peso nas vendas de 43%, o valor mais
alto obtido e praticamente o dobro da representatividade do grupo de controlo na amostra.
Ao invés na tipologia de desconto em euros o peso nas vendas do grupo de controlo é de
apenas 10%, bastante inferior á sua representatividade na amostra.
O grupo de clientes que estava abrangido pela tipologia de campanha percentual,
é representado pelos clientes perdidos que apresentam um ticket médio superior, ou seja
representa o cliente que tem uma compra mais racional de artigos de PVP superior. Tal
como foi referido anteriormente, a altura do período promocional é um período de
renovação de equipamentos de Futebol e regresso aos treinos, bem como as boas
condições climatéricas do período da campanha assumem-se como um fator importante
para o regresso ao consumo destes artigos, o que pode ser justificativo do elevado peso
de vendas apresentado.
A tipologia de desconto em euros revelou-se a mais eficaz, pois o grupo que está
abrangido por esta tipologia representou cerca de 90% das Vendas líquidas totais dos dois
grupos.
Gráfico 4 – Vendas liquídas na Empresa
42
As Vendas Líquidas efetuadas pelos grupos de clientes abrangidos neste estudo nas
restantes categorias da Empresa revelaram-se volumosas, o que relembrando que se
referem a clientes que não tinham registo de transações em cartão há pelo menos um ano,
os números apresentados são surpreendentes, pois perfazem um total de 39470€, e
pesaram quase 1% das vendas totais da Empresa nesse período.
Nesta análise consegue-se ver um padrão nos grupos de clientes que estavam
abrangidos pela campanha de 5€, que obteve uma maior eficácia na atratividade ao
consumo por parte desses clientes, não em volume, mas sim no peso das vendas totais,
que foi sempre superior aos 75%, representativos da amostra destes grupos de clientes.
Este grupo de clientes foi selecionado para estar abrangido pela tipologia de
campanha em euros, pois dentro do cluster, definido como o de “clientes perdidos” é o
que apresenta historicamente o Ticket médio inferior e em que, a vantagem de obterem
5€ para utilizarem numa futura transação, foi suficiente para atraí-los à loja e
consequentemente a realizarem alguma compra por impulso de algo que necessitavam
associado a outra categoria.
A Tipologia de campanha em percentual revelou ser a que gerou o maior volume
de vendas líquidas, mas revelou também um menor peso versus o grupo de controlo. Em
Calçado Futebol e de Running o peso da Vendas Líquidas ficou abaixo dos 75%, valor
representativo na amostra dos clientes abrangidos pelas campanhas promocionais.
Assume-se que este volume de vendas associado a este tipo de cliente – com um ticket
médio superior dentro do cluster selecionado – adveio de um acréscimo do fluxo de
clientes à loja, que pode ser explicado pelo elevado crescimento do índice de confiança
do consumidor no mês de junho, reportado pelo Banco de Portugal (2017), que demonstra
uma maior confiança dos consumidores e que leva a que estes se sintam mais confiantes
em aumentar o seu consumo em diversos bens.
Campanha G. Controlo
Calçado Fut_20pct 70% 30%
Calçado Fut_5eu 77% 23%
Textil Fit_20pct 75% 25%
Textil Fit_5eu 81% 19%
Calçado Run_20pct 56% 44%
Calçado Run_5eu 80% 20%
Tabela 11 - Percentagem de Consumo na Empresa
43
Ao analisarmos os dois gráficos em conjunto conseguimos perceber que as
tipologias de campanhas em euros efetuadas nas categorias de Calçado Futebol e Calçado
Running demonstram sem dúvida serem as mais eficazes, quer nos aspetos de atração ao
consumo na categoria quer ao consumo efetuado nas categorias em geral. Estes resultados
permitem ter um pequeno indício de qual será a tipologia de campanha mais eficaz dentro
destas duas categorias.
5.3. Ticket Médio
O Ticket médio é uma variável muito utilizada pelos retalhistas, permite-nos
perceber qual é a média de euros despendidos por transação, isto é qual é o valor médio
gasto por cliente em cada compra. A importância desta variável acontece pois o seu
aumento implica um aumento direto nas Vendas da Empresa.
Esta variável foi usada como critério de seleção dos clientes que iriam ser
abrangidos por cada tipologia de campanha. Os clientes que historicamente tinham um
ticket médio superior na categoria foram abrangidos pela tipologia de desconto
promocional em percentagem e os clientes com um ticket médio inferior foram
abrangidos por uma tipologia de desconto em Euros.
Na Tabela 12, conseguimos observar o ticket médio pelas diferentes categorias,
pelas tipologias de campanha e diferenciado pelo grupo contemplado pela campanha e
pelo grupo de controlo. Estes valores de ticket médio são de compras efetuadas nas
categorias em que cada grupo se encontra abrangido.
Campanha G. Controlo
Calçado Fut_20pct 38,38 € 53,60 €
Calçado Fut_5eu 31,17 € 28,45 €
Textil Fit_20pct 11,84 € 14,22 €
Textil Fit_5eu 16,67 € 14,71 €
Calçado Run_20pct 52,77 € 58,05 €
Calçado Run_5eu 37,29 € - €
Tabela 12 – Ticket Médio nas categorias
44
Como é possível verificar, apenas as tipologias de desconto em euros apresentaram
um ticket médio superior ao do grupo de controlo. Nas tipologias de desconto em
percentual o grupo de controlo apresentou valores superiores aos do grupo abrangido
pelas campanhas.
Tal como referido anteriormente o expectável era que os clientes abrangidos pela
tipologia de desconto em percentual apresentassem um ticket médio superior pois era este
o seu critério de seleção. Em Têxtil Fitness o expectável não aconteceu, os clientes que
estavam abrangidos pelo desconto em euros tiveram um ticket médio quase 5 euros
superior ao dos clientes abrangidos pela tipologia de desconto percentual.
O ticket médio das transações efetuadas nas restantes categorias (Tabela 13)
apresenta ligeiras diferenças face aos resultados apresentados ao nível da categoria. Em
Têxtil Fitness o ticket médio superior passou a ser o da tipologia de desconto em
percentagem, uma indicação de que apesar dos clientes terem tido um ticket médio
inferior, denotou que os clientes fizeram compras de valor superior nas restantes
categorias, gerando um resultado superior à outra tipologia promocional.
A categoria em destaque é a de Calçado Running em que, os clientes que estavam
abrangidos pela tipologia de desconto em euros tiveram um ticket médio no total da
Empresa, superior à outra tipologia promocional aplicada. Pode-se concluir que este
grupo de clientes ficou mais sensível a compras de valor elevado nas restantes categorias,
quer por necessidade pura para compra quer por crosseling efetuado na loja.
Campanha G. Controlo
Calçado Fut_20pct 25,91 € 28,74 €
Calçado Fut_5eu 23,16 € 22,57 €
Textil Fit_20pct 28,90 € 31,38 €
Textil Fit_5eu 22,05 € 20,23 €
Calçado Run_20pct 25,51 € 56,92 €
Calçado Run_5eu 30,32 € 20,50 €
Tabela 13 – Ticket Médio na Empresa
45
5.4. Rentabilidade
Nesta secção vamos falar do fator mais importante para a rentabilidade de uma
Empresa, a Margem.
A Margem obtida corresponde ao lucro que advém da venda de um artigo, isto é, o
valor que recebemos depois de suportados todos os custos do artigo. Esta variável permite
perceber se é rentável a venda de qualquer artigo, pois se a margem for positiva é
sinónimo de lucro na venda de um artigo, enquanto se a margem for negativa representa
perda de dinheiro na venda de artigo.
No Gráfico 5 pode verificar-se em detalhe a Margem em euros obtida em compras
nas categorias onde a campanha foi efetuada. Os resultados obtidos no grupo de controlo
Gráfico 5 – Margem em Euros na Categoria
Campanha G. Controlo
Calçado Fut_20pct 61% 39%
Calçado Fut_5eu 87% 13%
Textil Fit_20pct 86% 14%
Textil Fit_5eu 75% 25%
Calçado Run_20pct 89% 11%
Calçado Run_5eu 100% 0%
Tabela 14 – Peso da Margem na Categoria
46
foram maioritariamente de valor baixo, excetuando a campanha promocional em
percentagem efetuada em Calçado Futebol e a campanha promocional em euros em Têxtil
Fitness. Nestes dois casos a percentagem de consumo no total da categoria do grupo de
controlo foi igual ou superior à sua representatividade na amostra.
Nas restantes categorias o resultado foi positivo sendo que, se olharmos para a
margem total obtida em todas as categorias o resultado é de cerca de 680€ nos grupos
abrangidos pela campanha, versus um total de cerca 195€ obtidos no grupo de controlo,
sendo que dois terços deste valor advêm apenas da campanha em percentagem de Calçado
Futebol.
Este resultado foi similar à margem obtida na restante Empresa (Gráfico 6).
Numa ótica geral assistimos novamente a um resultado positivo em todas as
categorias, com exceção da campanha em percentagem efetuada em Calçado Futebol e
Gráfico 6 – Margem em Euros na Empresa
Campanha G. Controlo
Calçado Fut_20pct 65% 35%
Calçado Fut_5eu 76% 24%
Textil Fit_20pct 77% 23%
Textil Fit_5eu 80% 20%
Calçado Run_20pct 100% 0%
Calçado Run_5eu 66% 34%
Tabela 15 – Peso da Margem na Empresa
47
da campanha em euros efetuada em Calçado Running. Como denominador comum entre
os resultados da margem obtida pela amostra nas categorias e na restante Empresa, temos
a campanha em percentagem em Calçado Futebol, o que demonstra que esta tipologia de
campanha não foi efetivamente rentável para a Empresa.
Nas restantes categorias vemos que a maioria foi rentável, como é possível verificar
pelos pesos de cada grupo no total da margem da categoria (Tabela 15), contudo no diz
respeito à rentabilidade conseguimos afirmar que em Calçado Futebol é mais rentável a
tipologia promocional de valor monetário. Esta foi mais eficaz quer na margem obtida na
categoria, quer nas restantes categorias da Empresa.
5.5. Eficiência do Estudo
Na presente secção resumem-se quais tipologias promocionais foram mais
eficientes junto dos clientes, nas variáveis em análise dos resultados – Taxa de
Transações, Vendas Líquidas, Ticket Médio e Margem.
Apresenta-se em Tabela o resumo de que tipologia promocional se revelou mais
eficiente, na combinação das variáveis em análise no Capítulo 4 - divido por linhas - e da
dimensão em análise, ao detalhe da categoria e no geral da Empresa – dividido em
colunas.
Sempre que a tipologia promocional em percentagem for a mais eficiente na
combinação da Variável e dimensão em análise, será representado pelo símbolo”%” e se
o contrário se suceder, em que a tipologia promocional mais eficiente for a de Valor
Monetário, a mesma será representada pelo símbolo “€”. Nos caso de nenhuma das
campanhas ser eficiente na combinação em análise, nessa situação utilizar-se-á o símbolo
”-“.
Calçado Futebol Categoria Empresa
Taxa de Conversão € €
Vendas Liquidas € €
Margem € €
Ticket Médio € €
Tipologia Promocional
Tabela 16 - Eficiência da Tipologia promocional em Calçado Futebol
48
Como foi possível observar nas restantes secções do capítulo 5, no caso do Calçado
Futebol destaca-se um padrão, sobre qual se constata que a melhor tipologia de desconto
a implementar será a de valor monetário (Tabela 16), tendo em conta que se revelou ser
a mais eficiente em todas as variáveis analisadas – Taxa de conversão, Vendas Líquidas,
Ticket médio e Margem - tanto na ótica da categoria como na ótica geral da Empresa.
Pode-se afirmar que os “clientes perdidos” desta categoria deram uma resposta clara sobre
qual a tipologia promocional que os atrai novamente à loja, independentemente do
objetivo dessa atração, seja para consumo dentro da categoria, ou para consumo nas
restantes categorias da Empresa.
Na categoria de Têxtil Fitness observa-se um comportamento diferente do
demonstrado na categoria de Calçado Futebol. Os resultados (Tabela 17) não foram
completamente uniformes, contudo permitem retirar conclusões dos mesmos. Numa ótica
geral da Empresa, a tipologia promocional de valor monetário foi a mais eficiente,
revelou-se superior à tipologia de desconto em percentual nas quatro variáveis em análise
nas anteriores secções deste Capítulo. No que diz respeito à tipologia promocional mais
eficiente a comunicar para atração dos clientes na categoria de Têxtil Fitness, não se
obtiveram resultados que permitissem objetivamente concluir qual a tipologia
promocional mais eficiente, como se pode verificar na variável das vendas Líquidas, em
que nenhuma das duas tipologias promocionais se mostrou eficaz no aumento das
mesmas. No entanto, no caso de se pretender analisar o aumento de Margem e/ou o
aumento do número de transações, a tipologia promocional mais eficiente é a percentual,
e no caso de se pretender um aumento do ticket médio a tipologia promocional de valor
monetário revela-se a mais eficiente.
Textil Fitness Categoria Empresa
Taxa de Conversão % €
Vendas Liquidas - €
Margem % €
Ticket Médio € €
Tipologia Promocional
Tabela 17 - Eficiência da Tipologia promocional em Têxtil Fitness
49
Na Tabela 18, resumimos a eficiência para a Categoria de Calçado Running,
observa-se que os resultados são praticamente uniformes, quer na categoria quer na ótica
geral da Empresa. A tipologia promocional de valor monetário foi a mais eficiente em
praticamente todas as variáveis, excetuando na Margem e no número de transações na
ótica geral da Empresa. Na primeira variável se pretendermos o aumento da mesma, a
tipologia promocional em percentagem revelou-se mais eficiente e na segunda variável
nenhuma das tipologias promocionais se revelou eficiente.
Calçado Running Categoria Empresa
Taxa de Conversão € -
Vendas Liquidas € €
Margem € %
Ticket Médio € €
Tipologia Promocional
Tabela 18 - Eficiência da Tipologia promocional em Calçado Running
50
6. Conclusão , limitações do estudo e considerações finais
Neste Capítulo será apresentada a conclusão do trabalho, sendo detalhada por
Categoria e conduzindo-nos assim ao objetivo deste estudo, o de perceber a tipologia
promocional a comunicar aos clientes para a sua atração à loja.
Apresenta-se propostas de como a partir deste estudo se poderá potenciar o caminho
para uma análise mais detalhada, que permita ultrapassar limitações colocadas atualmente
por parte da Empresa.
A realização deste estudo teve algumas limitações, como é o caso das datas
pretendidas para a realização das campanhas promocionais,que não foram aceites devido
ao plano promocional já estipulado pela Empresa. As datas onde o estudo se realizou
foram as únicas disponibilizadas pela Empresa para o efeito, não tendo a possibilidade de
movimentar o prazo das mesmas. Outra condicionante deste estudo foi o limite de
orçamento disponível para a implementação das campanhas, por ser muito reduzido, não
superando os 205€, o que não permitia contactar todos os clientes inicialmente
pretendidos. Apesar destas limitações foi possível efetuar um estudo homogéneo pelas
três categorias selecionadas, estas foram trabalhadas uniformemente seguindo sempre a
mesma metodologia e aplicação da mesma em vigor.
A tipologia promocional de valor monetário revelou-se no global como a mais
eficiente e impactante junto dos “clientes perdidos”, transversalmente nas duas dimensões
analisadas – o detalhe da categoria e o geral da Empresa - foi a tipologia sempre em
destaque, sendo em Calçado Futebol a mais eficiente em todas as combinações, e nas
restantes duas categorias, revelou-se a mais eficiente na maior parte dos casos.
Se tivermos uma visão global dos resultados das duas tipologias promocionais,
ambas apresentaram uma performance positiva na atração dos clientes. A performance
histórica da Empresa em campanhas promocionais comunicadas via SMS, ronda os 0.5%
e 0.8% dos clientes contactados. Os clientes abrangidos pelo estudo não só tiveram uma
resposta positiva no regresso à loja, como também se revelaram mais propensos ao
consumo quando os comparamos ao grupo de controlo.
51
Este resultado permite concluir que os “clientes perdidos” nas três categorias do
estudo respondem melhor a uma comunicação em que lhes explicitado o valor que vão
ter como benefício, isto pode permitir ao departamento de marketing que, em próximas
ações promocionais a realizar nas categorias em questão, tenha um fundamento sobre
como deve desenvolver a comunicação a dirigir ao cliente, quer seja em ações
promocionais espontâneas ou em folhetos promocionais.
Um dos objetivos paralelos do estudo realizado era que fosse rentável para a
Empresa, fator de extrema importância para a validade e possibilidade da sua
continuidade. O custo total para a Empresa deste estudo foi de 204€. Para considerarmos
o estudo rentável a diferença na Margem, considerando apenas o consumo efetuado na
categoria entre o grupo abrangido pelas Campanhas e o Grupo de Controlo, terá de ser
superior a 204€ em favor do grupo das campanhas. O total da Margem obtida pelo Grupo
das campanhas foi de 680,38€, e o total do Grupo de Controlo foi de 194,73€. A diferença
entre ambos é de 485,65€, em benefício do grupo das campanhas, ou seja mais do dobro
do custo total que a Empresa teve de suportar, o que demonstra que este estudo apresentou
lucro à Empresa.
Tal como referido anteriormente, este estudo tem por objetivo permitir futuramente
o desenvolvimento de um trabalho mais detalhado. Com base nesta intenção são
apresentadas propostas para a sua continuidade e complementação:
a) Alargar este estudo à totalidade da Empresa para perceber a sensibilidade dos
“clientes perdidos” nas diferentes tipologias promocionais.
b) Medir uma segunda taxa de retorno, isto é, dos clientes que ficaram com o valor
em cartão resultante das campanhas promocionais efetuadas, qual a taxa de
clientes que rebate o valor que acumulou em cartão e em que periodicidade o
realiza.
c) Estudar diferentes percentagens de desconto, de forma a determinar a partir de
que valor percentual a tipologia promocional em valor monetário deixa de ser a
mais eficaz.
d) Utilizar diferentes tipologias promocionais, das aplicadas neste estudo, de forma
a perceber a eficácia das mesmas nos “clientes perdidos”.
52
Bibliografia
Berkhin, P. (2006). "A survey of clustering data mining techniques." Grouping multidimensional data 25: 71.
Birant, D. (2011). Data mining using rfm analysis, INTECH Open Access Publisher.
Brito, P. Q. (2012). "Promoção de Vendas e Comunicação de Preços." Almedina Editores.
Buckinx, W. and D. Van den Poel (2005). "Customer base analysis: partial defection of behaviourally loyal clients in a non-contractual FMCG retail setting." European Journal of Operational Research 1(164): 252-268.
Bult, J. R. and T. Wansbeek (1995). "Optimal selection for direct mail." Marketing
Science 14(4): 378-394. Chiu, T., et al. (2001). A robust and scalable clustering algorithm for mixed type attributes
in large database environment. Proceedings of the seventh ACM SIGKDD international conference on knowledge discovery and data mining, ACM.
Coussement, K., et al. (2014). "Data accuracy's impact on segmentation performance: Benchmarking RFM analysis, logistic regression, and decision trees." Journal of Business
Research 67(1): 2751-2758.
Hosseini, S. M. S., et al. (2010). "Cluster analysis using data mining approach to develop CRM methodology to assess the customer loyalty." Expert Systems with Applications 37(7): 5259-5264.
Hsieh, N.-C. (2004). "An integrated data mining and behavioral scoring model for
analyzing bank customers." Expert Systems with Applications 27(4): 623-633. Jain, A. K. (2010). "Data clustering: 50 years beyond K-means." Pattern recognition
letters 31(8): 651-666.
Jain, A. K., et al. (1999). "Data clustering: a review." ACM computing surveys (CSUR) 31(3): 264-323.
Jonker, J.-J., et al. (2004). "Joint optimization of customer segmentation and marketing policy to maximize long-term profitability." Expert Systems with Applications 27(2):
159-168. Kass, G. V. (1980). "An exploratory technique for investigating large quantities of
categorical data." Applied statistics: 119-127.
Kotler, P. and G. Armstrong (2010). Principles of marketing, pearson education.
53
Laroche, M., et al. (2003). "A model of consumer response to two retail sales promotion
techniques." Journal of Business Research 56(7): 513-522.
Mirkin, B. (2012). Clustering: a data recovery approach, CRC Press. Oliveira-Brochado, A. and F. V. Martins (2008). "Aspectos Metodológicos da
Segmentação de Mercado: base de segmentação e métodos de classificação." Revista Brasileira de Gestão de Negócios 10(27): 132-149.
Rokach, L. and O. Maimon (2005). Clustering methods. Data mining and knowledge discovery handbook, Springer: 321-352.
Sarstedt, M. and E. Mooi (2014). "A Concise Guide to Market Research." The Process,
Data, and. Schneider, L. G. and I. S. Currim (1991). "Consumer purchase behaviors associated with
active and passive deal-proneness." International Journal of Research in Marketing 8(3): 205-222.
Shih, M.-Y., et al. (2010). "A two-step method for clustering mixed categroical and
numeric data." 淡江理工學刊 13(1): 11-19.
Smith, W. R. (1956). "Product differentiation and market segmentation as alternative marketing strategies." Journal of marketing 21(1): 3-8.
Sohrabi, B. and A. Khanlari (2007). "Customer lifetime value (CLV) measurement based on RFM model." Iranian Accounting & Auditing Review 14(47): 7-20.
Steinhaus, H. (1956). "Sur la division des corp materiels en parties." Bull. Acad. Polon. Sci 1(804): 801.
Sun, S. (2009). "An analysis on the conditions and methods of market segmentation."
International Journal of Business and Management 4(2): 63. Thorndike, R. L. (1953). "Who belongs in the family?" Psychometrika 18(4): 267-276.
Wedel, M. and W. A. Kamakura (2012). Market segmentation: Conceptual and methodological foundations, Springer Science & Business Media.
Wei, J.-T., et al. (2010). "A review of the application of RFM model." African Journal of
Business Management 4(19): 4199. Zhang, T., et al. (1996). BIRCH: an efficient data clustering method for very large
databases. ACM Sigmod Record, ACM.
54
Banco de Portugal (2017),
http://www.bportugal.pt/Mobile/BPStat/Serie.aspx?IndID=826850&SerID=2027647&s
r=2027636-2027657&View=graph&SW=1349&EndYear=2017&IniYear=2000,
acedido em 20 de julho 2017.
Statista (2017), https://www.statista.com/statistics/241885/sporting-goods--sportswear-
companies-revenue-worldwide/, acedido em 23 de junho de 2017.
PORDATA (2017), https://www.pordata.pt/Subtema/Portugal/Desporto-192, acedido
em 14 de julho de 2017.
55
Anexos