ANÁLISE ESTATÍSTICA
MULTIVARIADA: AVALIANDO A
(IN)SOLVÊNCIA DE EMPRESAS
COMERCIAIS UTILIZANDO
REGRESSÃO LOGÍSTICA
JOSE WILLER DO PRADO (UFLA )
FABIOLA ADRIANE CARDOSO SANTOS (IFMG )
LUIZ KENNEDY CRUZ MACHADO (UFLA )
ANDRE SPURI GARCIA (UFLA )
MARCO TULIO DINALI VIGLIONI (UFLA )
Na atualidade, as empresas que oferecem crédito buscam cada vez
mais o auxílio de ferramentas estatísticas modernas para combater a
inadimplência em suas transações. A análise correta do crédito sempre
se apresentou como fator chave para ass instituições que o fornecem.
Nesse sentido, o objetivo do presente estudo é gerar um modelo de
Credit Scoring (modelo estatístico de avaliação do crédito)
empregando as técnicas de Análise Fatorial e Regressão Logística
para avaliar a capacidade de classificação de insolvência e solvência
para empresas comerciais. Por estas técnicas obtivemos os parâmetros
a respeito do grau de eficiência do modelo gerado e aplicado às
empresas comerciais. Observou-se, ainda, que o método de Análise
Fatorial auxiliou a Regressão Logística na acurácia de acerto para a
classificação. Pode-se concluir que após o uso da Análise Fatorial a
Regressão Logística obteve precisão de acerto de 92% nas
classificações de empresas comerciais, o que valida o modelo. Neste
sentido, o modelo gerado é apropriado para a classificação do risco de
crédito.
Palavras-chave: Reconhecimento de padrões, análise de crédito,
análise fatorial
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016.
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
2
1. Introdução
Na atualidade os mercados se tornaram mais expostos a uma instabilidade mundial que surge
independente da empresa participar ou não de determinado nicho de mercado. O medo de que
uma nova bolha não sistêmica cause uma crise global sistêmica é sempre iminente e
acompanhada por todos os agentes. Neste sentido, as empresas que oferecem crédito buscam
cada vez mais o auxílio de ferramentas para combater a inadimplência em suas transações. O
conhecimento destas pode ajudar a modelar a probabilidade de insolvência das empresas.
Segundo Boratti (2002) e Prado et al. (2016), os principais estudos envolvendo a análise de
crédito tiveram início com o trabalho de Edward Altman em 1968, quando o autor utilizou
instrumentos estatísticos mais robustos, como é o caso da análise discriminante múltipla, para
avaliar a insolvência empresarial. No Brasil, segundo estes autores, o pioneiro no uso da
análise discriminante foi Stephen Charles Kanitz em 1978 com o livro “Como prever
falências”.
A análise correta do crédito sempre se apresentou como fator chave para as instituições que o
fornecem. A importância desta para o sistema financeiro é facilmente observada nos relatórios
emitidos pelo Banco Central do Brasil (BACEN, 2016). Segundo o BACEN (2016), o volume
total dos empréstimos no sistema financeiro atingiu R$3.026 bilhões em fevereiro de 2016,
um aumento de 11,0% em doze meses. Por sua vez, a relação crédito/PIB saltou de 55,5% em
fevereiro de 2015 para 58,6% para o mesmo período de 2016.
O crédito para o setor privado totalizou R$2.812 bilhões em fevereiro de 2016, aumentando
2,1 % no trimestre. A taxa de inadimplência das modalidades que compõem o crédito
referencial (taxa média de juros nos atrasos superiores há 90 dias) atingiu 2,8% em fevereiro,
com estabilidade no trimestre e recuo de 0,1 p.p. em doze meses (BACEN, 2016).
Neste contexto, algumas das ferramentas utilizadas pelos analistas de crédito para tentar
diminuir a taxa de inadimplência nas transações estão na análise dos indicadores econômico-
financeiros das empresas, por meio de técnicas multivariadas tais como a Análise Fatorial e a
Regressão Logística. Estas têm por finalidade descrever a relação entre diversas variáveis
(observações) independentes, possibilitando a análise simultânea de medidas múltiplas para
cada indivíduo, além de ser adequada para a análise dos indicadores econômico-financeiros
das empresas.
Diante do exposto, o objetivo do presente estudo é gerar um modelo de Credit Scoring
(modelo estatístico de avaliação do crédito) empregando as técnicas de Análise Fatorial e
Regressão Logística para avaliar a capacidade de classificação de insolvência e solvência para
empresas comerciais.
Além desta introdução, o trabalho conta com uma segunda seção que irá tratar do referencial
teórico sobre o tema, com uma breve exposição sobre os indicadores econômico-financeiros.
A terceira seção trabalha os critérios metodológicos e apresenta a Regressão Logística e a
Análise Fatorial. A quarta seção é composta pela discussão dos resultados. Por fim, a última
seção aborda as considerações finais, destacando os principais achados.
2. Referencial teórico
Uma vez que o tema é relevante para a economia como um todo, vários autores fizeram
considerações sobre o crédito. Uma das definições mais encontradas em trabalhos sobre
crédito é de autoria de Schrickel (2000, p. 25), que o define como:
Todo ato de vontade ou disposição de alguém de destacar ou ceder,
temporariamente, parte de seu patrimônio a um terceiro, com a expectativa de que
esta parcela volte a sua posse integralmente, depois de decorrido o tempo estipulado.
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
3
Essa parte do patrimônio pode ser materializada por dinheiro (empréstimo
monetário) ou bens (empréstimo para uso, ou venda com pagamento parcelado, ou a
prazo).
Neste contexto, as técnicas estatísticas multivariadas têm sido utilizadas na concessão de
crédito e consideradas como ferramentas úteis no reconhecimento da inadimplência de
crédito. Silva (2008) salienta que na criação de um modelo de previsão de risco de crédito é
importante saber identificar qual dentre as técnicas estatísticas será a mais eficiente para a
modelagem dos dados, de maneira a conseguir uma melhor previsão para a inadimplência.
Santos (2012) elucida que a abordagem estatística, baseada na pontuação, se originou como
um dos métodos mais importantes de suporte à tomada de decisão para grandes volumes de
propostas de crédito, tanto para pessoas físicas como jurídicas.
Silva (2008) salienta que devido à sua contribuição para o processo de análise, o uso de
métodos quantitativos tem sido muito divulgado, levando muitos bancos a uma corrida em
busca de técnicas para avaliação do risco de crédito dos clientes. Entretanto, esses métodos de
previsão não podem ser interpretados como receitas milagrosas capazes de resolver todos os
problemas advindos do risco de crédito contido nas operações. Neste sentido, os modelos
devem ser interpretados como um instrumento complementar para o analista (SILVA, 2008).
2.1 Indicadores econômico-financeiros
A análise dos indicadores econômico-financeiros é considerada, por muitos autores, de grande
valia quando se trata de obter informações advindas do Balanço Patrimonial e da
Demonstração de Resultados da empresa. Segundo Assaf Neto (2005), para se estabelecer
uma melhor metodologia de avaliação e compreender melhor o significado dos indicadores
econômico-financeiros é necessário dividir os indicadores em grupos homogêneos de análises.
Atualmente vários são os indicadores econômico-financeiros apresentados na literatura. Estes,
no entanto, são agrupados em categorias por suas afinidades. As categorias mais vistas em
livros de finanças são: Indicadores de Estrutura de Capitais; Indicadores de Liquidez;
Indicadores de Atividade; Indicadores de Análises de Ações; Indicadores de Endividamento e
Estrutura; Indicadores de Rentabilidade e Indicadores de Valor de Mercado.
Na prática, o especialista procura fazer com que cada um dos indicadores apresente o maior
número de informações possíveis sobre a empresa. Neste sentido, a busca por um pequeno
grupo de indicadores que consiga explicar de maneira objetiva o comportamento financeiro de
uma empresa é considerado o ideal para a análise (SILVA, 2008).
3. Metodologia
O presente estudo se constitui em uma pesquisa predominantemente explicativa. A pesquisa
explicativa busca esclarecer quais fatores contribuem para a ocorrência de determinado
fenômeno (VERGARA, 2008). Quanto à forma de abordagem, esta pesquisa é qualificada
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
4
como quantitativa. Segundo Martins e Theóphilo (2009, p.107), nesse tipo de pesquisa os
dados são quantificados e a validação da prova científica utiliza testes, graus de significância
e sistematizações.
O banco de dados foi selecionado em corte-transversal (crosssection) e os dados são
secundários e retirados da pesquisa de Carvalho (2004). A amostra contém cinquenta
empresas solventes e cinquenta empresas insolventes. Estes últimos dados foram coletados
um ano antes da ocorrência de insolvência. Ademais, as insolventes foram classificadas como
grupo „1‟ e as solventes como grupo „0‟. Das 100 empresas comerciais, 33 são Açougues, 17
Distribuidora de Bebidas, 13 Hortifrutigranjeiros, 25 Padarias e 12 Peixarias. O recurso
computacional utilizado para análise dos modelos estatísticos é o Statistic Package for the
Social Science® (SPSS).
3.1 Indicadores econômico-financeiros
Já a escolha dos indicadores econômico-financeiros utilizados neste artigo deve-se ao fato de
Sanvicente e Minardi (1998), Silva (2004) e Prado (2016) os terem enfatizado como
indicadores significativos para a previsão de insolvência de empresas. Neste sentido, a Tabela
1 demonstra os indicadores econômico-financeiros utilizados como variáveis (independente). Tabela 1 – Indicadores econômico-financeiros utilizados
Fonte: Adaptado de Sanvicente e Minardi (1998), Carvalho (2004), Silva (2004) e Prado (2016)
Definidas as variáveis utilizadas para estimar o modelo de Regressão Logística, o primeiro
passo é efetuar a substituição dos termos insolventes e solventes por números. Com este
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
5
artifício, na Regressão Logística para “empresas insolventes” atribui-se o número “1” e no
lugar de “empresas solventes” atribui-se o valor “0”. Faz-se necessário mencionar que na
Regressão Logística a variável dependente (variável resposta) é do tipo dicotômica e assume
apenas dois valores possíveis “0” ou “1”.
2.2 Regressão logística
A regressão logística (logistic regression ou logit analysis), segundo Guimarães e Chaves
Neto (2002), consiste fundamentalmente na busca de um modelo que permita relacionar uma
variável y, chamada “variável resposta” (variável dependente), aos “fatores” (variáveis
independentes) X1i, X2i, ..., Xni que supõe-se influenciar as ocorrências de um evento. A
variável resposta, no entanto, deve ser do tipo dicotômica, assumindo apenas dois valores
possíveis (0 ou 1). Neste caso, existe interesse apenas na ocorrência, ou não, do evento em
questão.
O modelo de regressão logística pode ser representado por uma função da seguinte forma:
(1)
Onde:
P (Y=1) = é a probabilidade relativa que um determinado evento ocorra;
e ≅ 2,718;
(x) = B0 + B1X1i + B2X2i+ ⋅⋅⋅ + BnXni ;
Sendo que:
B0 é uma constante e B1, B2 ... Bn são os coeficientes estimados a partir dos dados de
X1i, X2i, ..., Xni (variáveis independentes).
Hosmer Junior e Lemeshow (2004) salientam que os coeficientes B0, B1, ..., Bn são estimados
a partir do conjunto de dados em questão pelo método da máxima verossimilhança, que
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
6
encontra uma combinação de coeficientes que maximiza a probabilidade da amostra ter sido
observada. Considerando certa combinação de coeficientes B0, B1, ..., Bn e variando os
valores de X observa-se que a curva logística tem comportamento probabilístico em forma de
S (FIGURA 1).
Figura 1 – Gráfico da Função Sigmóide
Fonte: Guimarães e Chaves Neto (2002, p. 8)
Para estimar o modelo de regressão logística esta função sigmóide (curva logística) é ajustada
aos dados reais. Esse formato dado á regressão logística possui um alto grau de generalidade,
aliada a aspectos muito desejáveis, como:
1º - Quando (x) → + ∞, então P (Y = 1)→ 1
2º - Quando (x) → − ∞, então P (Y = 1)→ 0
Assim, tanto se pode estimar diretamente a probabilidade de ocorrência de um evento como se
pode estimar a probabilidade de não ocorrência do mesmo por diferença:
P (Y = 0) = 1 – P (Y = 1) (2)
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
7
Entretanto, segundo Corrar et al. (2007) o primeiro passo para dar início a regressão logística
é converter a probabilidade associada a cada observação em razão de chance (odds ratio), ou
seja, a possibilidade de sucesso comparada a de fracasso.
Esta relação pode ser expressa da seguinte forma:
(3)
Ao utilizar-se a regressão logística, para facilitar a interpretação dos resultados, a principal
suposição é a de que o logaritmo da razão entre as probabilidades de ocorrência e não
ocorrência do evento seja linear:
(4)
E, por conseguinte,
(5)
Por isso, segundo Garson (2000), ao se fazer a interpretação dos coeficientes da regressão
logística opta-se por interpretar o eB e não diretamente o B.
2.3 Análise fatorial
A Análise Fatorial (AF), segundo Corrar et al. (2007), pressupõem que altas correlações entre
as variáveis geram o agrupamento que configura os fatores. É preciso levar em consideração
que a simples existência do fator explica a correlação que existe em um determinado grupo de
variáveis. A Análise Fatorial, quando desvenda um fator, torna estruturas complexas de
relacionamento em estruturas mais simples de serem compreendidas (FIGURA 2).
Figura 2 – Variáveis latentes e a formação de fatores
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
8
Fonte: Corrar et al. (2007, p. 75)
Spearman (1904) sugeriu a existência de uma variável “invisível” que explica parcialmente as
variações em cada uma delas. Uma variável padronizada (de média zero e variância um) – Xi
– é explicada por uma constante – αi – multiplicada por um fator (de média zero e variância
um) – F. Todavia é preciso considerar um erro – ei – devido ao fato de que uma variável
possui características que não são comuns a nenhuma das outras variáveis no estudo, por isso
o fator não consegue explicá-la (CORRAR et al., 2007).
Esta pode ser visualizada assim:
Xi = αi F + ei (6)
Onde:
Xi = variável i analisada
αi = é uma constante
F = é o fator
ei = é o erro
Assim, o fator representa a parcela da variação total dos dados que pode ser explicada de
forma conjunta para todas as variáveis que o compõem.
As variações em uma variável podem ser explicadas pelo seguinte modelo:
(7)
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
9
Onde Xi são as variáveis padronizadas, αi são as cargas fatoriais, Fj são os fatores comuns e ei
é o erro que representa a parcela da variável i que não pode ser explicada por um fator nem
por outra variável do conjunto analisado.
Por sua vez, os fatores poderiam ser estimados pela combinação linear das variáveis
originais:
(8)
Onde Fj são os fatores comuns não relacionados, ωji são os coeficientes dos escores fatoriais e
Xi são as variáveis originais.
Assim, é possível determinar o que realmente é importante ser medido e acompanhado a partir
do ponto que se conhece o grau de relacionamento entre as variáveis. Segundo Hair et al.
(2009), as cargas fatoriais acima de 0,5 são consideradas estatisticamente significativas.
4. Resultados e discussão
Neste tópico são demonstrados os resultados obtidos a partir o modelo matemático gerado e
como estes se comportam na classificação dos casos sugeridos (Insolvente e Solvente).
4.1 Regressão logística
Para gerar o modelo de Regressão Logística optou-se pelo uso de todos os oito indicadores no
modelo. Entretanto, avaliando o modelo como um todo pelos testes Wald, Cox & Snell,
Nagelkerke e Hosmer & Lemeshow, observou-se que o modelo não apresentou uma
estatística robusta. Neste sentido, utilizou-se uma alternativa para agrupar variáveis a partir do
método de componentes principais (Análise Fatorial).
4.1.1 Análise fatorial para a regressão logística
Combinados os indicadores e as alterações nos números de fatores, considerando os testes
KMO, Teste de Barlett, MSA e Análise das Comunalidades, conclui-se que o melhor modelo
será gerado pelo agrupamento dos indicadores X3, X4, X5, X6, X7 e X8 em três fatores, os
dados gerados deste processo serão apresentados a seguir.
A Tabela 2 apresenta os resultados que validam a utilização da Análise Fatorial. O teste de
KMO (Kaiser-Meyer-Olkin) representa o grau de explicação das variáveis a partir dos fatores
encontrados, apresentando 0,672 - valor razoável na faixa de 0,6 a 0,7. O teste de Esfericidade
de Bartlett afirma que quanto mais próximo de zero for o nível de significância, maior será a
adequação da análise fatorial ao conjunto de dados (Sig. < 0,05).
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
10
Tabela 2 – Teste de KMO e Bartlett
Fonte: Dados da Pesquisa (2012)
A Tabela 3 apresenta a matriz de correlações anti-imagem que oferece sinais acerca da
necessidade de eliminação de alguma variável no modelo. A partir da análise da diagonal
principal da matriz identifica-se o índice de Medida de Adequação de Amostra (Measure of
Sampling Adequacy – MSA). Segundo Hair et al. (2009) valores nesta diagonal inferiores a
0,05, são considerados insignificantes para a análise e podem ser excluídos, o que não ocorre
nesta análise. Tabela 3 – Matriz Anti-imagem – Correlação
a. Medidas de adequação de amostragem (MSA)
Fonte: Dados da Pesquisa (2012)
Cabe observar que a tabela de comunalidades (Tabela 4) demonstra valores superiores a 0,9
indicando que cada variável poderia representar um único fator devido ao seu alto poder
explicativo em relação a todas as outras variáveis. Hair et al. (2009), afirmam que as
comunalidades representam a quantia de variância explicada pela solução fatorial para cada
variável. Tabela 4 – Comunalidades
Fonte: Dados da Pesquisa (2012)
A Tabela 5 demonstra o grau de explicação atingido pelos fatores gerados pela análise
fatorial. Observa-se que os três fatores calculadas pela análise fatorial explicam 92% da
variância total dos dados originais. Para Corrar et al. (2007) os valores superiores a 90% são
considerados ótimos. Tabela 5 – Variação total explicada
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
11
Método de extração: análise do componente principal
Fonte: Dados da Pesquisa (2012)
Adiante, faz-se necessário a interpretação de quais variáveis irão compor cada um dos fatores
específicos. Para isso será usada a Matriz de Componente Rotativa (rotação ortogonal), que
segundo Corrar et al. (2007) é o tipo de rotação mais utilizado.
Na Tabela 6 pode-se verificar quais variáveis irão compor cada fator, ou seja, quando a
correlação da variável-fator é próxima de +1 ou -1, indicando uma associação positiva ou
negativa entre a variável e o fator, enquanto próxima de 0 indica uma falta de associação. Tabela 6 – Matriz de componente rotativa
Método de rotação: Varimax com normalização de Kaiser
Fonte: Dados da Pesquisa (2012)
Conclui-se com a Tabela 6 que:
O Fator 1 é composto pelos indicadores X4 (Relação entre o Lucro Operacional
acrescido das Despesas Financeiras e o Ativo Total deduzido dos Investimentos) e por
X5 (Margem de Lucro Operacional), este será nomeado de IR – Indicador de
Rentabilidade, considerando que estas duas variáveis compõem Indicadores de
Rentabilidade;
O Fator 2 é composto pelos indicadores X6 (Patrimônio Líquido sobre
Endividamento) e por X8 (Saldo de Tesouraria), este fator recebeu o nome de FD –
Fator Disponíveis. Considera-se, que as variáveis que o compõe recebem valores
maiores contribuem para que a empresa seja solvente e quando recebem valores
menores contribuem para o aumento dos exigíveis de curto prazo da empresa;
O Fator 3 é composto pelos indicadores X3 (Necessidade de Capital de Giro sobre
Vendas) e por X7 (Necessidade de Capital de Giro), que aqui será tratado por IL –
Indicador de Liquidez, em razão de suas variáveis pertencerem aos Indicadores de
Liquidez.
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
12
A partir do cálculo dos escores da Análise Fatorial inicia-se a Regressão Logística. Observa-
se que para utilizar os escores em outros procedimentos estatísticos, como é o caso da
Regressão Logística, estes coeficientes podem ser obtidos por três métodos diferentes.
Optamos apenas por utilizar o método de mínimos quadrados ordinários.
4.1.2 Regressão logística a partir dos fatores gerados pela análise fatorial
De posse do cálculo dos três fatores o modelo de Regressão Logística apresentou estatísticas
satisfatórias para o teste de Wald, que atingiu significância de 100% para a constante incluída
no modelo. No caso dos testes considerados pseudos-R², o Cox & Snell apresentou 51% de
explicação das variáveis independentes nas variações dentro do log da razão de chance,
enquanto o Nagelkerke afirma que o modelo é capaz de explicar aproximadamente 69% das
variações atribuídas a variável dependente.
No teste de Hosmer e Lemeshow os resultados são desfavoráveis, considerando que a
significância apresentada é inferior a 0,05 e, neste caso, quanto maior for à significância
melhor será o teste. Entretanto, existem algumas limitações em relação ao teste que podem
estar relacionadas ao tamanho da amostra (CORRAR et al., 2007). Contudo, como existem
outros indicadores de precisão favoráveis, decide-se dar continuidade as estatísticas.
A Tabela 7 demonstra que o modelo registra um percentual de acerto de 92% que é
considerado ótimo pelo fato de estar numa faixa acima de 90%. Estatisticamente, a utilização
dos fatores para o cálculo da Regressão Logística se apresenta de forma adequada para
classificar as empresas candidatas a crédito quanto a sua insolvência ou solvência. Tabela 7 – Tabela de classificação
a final
a. O valor de corte é 0,5
Fonte: Dados da Pesquisa (2012)
A Tabela 8 demonstra as variáveis que compõem o modelo de Regressão Logística. A
estatística gerada a partir dos Fatores (IR, FD e IL) apresenta aspectos positivos ao tentar
estimar a probabilidade a partir de cada coeficiente em particular, sendo eles: Estatística Wald
– apresenta um coeficiente Wald > 0 para cada fator, exercendo efeito discriminatório sobre a
probabilidade de a empresa ser insolvente ou solvente, Limite Superior e Inferior – os
coeficientes dos fatores independentes (B) elevados a constante e dentro do intervalo de
confiança. No exemplo do fator ID, o valor -3,731 elevado a constante e encontra-se na
coluna Exp(B) (0,024). Observa-se que este está no limite estabelecido pelas colunas Inferior
e Superior (0,004 a 0,144 respectivamente) assim como todos os outros fatores utilizados. E
Sig. – A significância (Sig.) é considerada boa conforme a Tabela 8, pois está abaixo de 0,05. Tabela 8 – Variáveis na equação
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
13
a. Variáveis inseridas na etapa 1: IR, FD, IL
Fonte: Dados da Pesquisa (2012)
Realizados os procedimentos obteve-se um modelo de Regressão Logística capaz de
classificar as empresas em insolvente e solvente. Utilizando-se dos coeficientes da Tabela 8
na coluna B pode-se esboçar a equação da Regressão Logística, ou seja, o Credit Scoring
gerado:
(9)
Pela equação observa-se que P (Y=1) apresenta saída do tipo dicotômica, assumindo apenas
dois valores possíveis “0” ou “1”. Assim, quanto mais próximo de 1 for o resultado, a
empresa será considerada insolvente. Quanto o resultado estiver próximo de 0 a empresa será
tratada como solvente.
5. Considerações finais
Em vista do exposto, conclui-se que o uso da Análise Fatorial contribui para desenvolver uma
estatística robusta para a Regressão Logística, que obteve 92% de precisão. Neste sentido, o
modelo gerado é apropriado para a classificação do risco de crédito.
Contudo, outro dado importante que pode ser observado na Tabela 7 situa-se no tipo de erro
ocorrido no modelo matemático. A Regressão Logística apresenta 7% de chances de incorrer
em erro do tipo I (classificar empresas insolventes como solventes e o empréstimo acarretar
em perdas financeiras) e 1% de chances de incorrer em erro tipo II (classificar empresas
solventes como insolventes e não conceder o crédito as mesmas, deixando assim de auferir
lucros). É importante mencionar que o erro tipo I para uma empresa que oferece crédito é o
pior tipo de erro, considerando que este resultará em perdas financeiras para a mesma.
O modelo matemático aqui apresentado tem o intuito de auxiliar o processo decisório do
gerente responsável pelo crédito e não substitui a sua opinião no ato de concessão de crédito.
Acredita-se que o profissional que conta com este tipo de recurso está em vantagem
competitiva sobre aqueles que não o utilizam no seu processo decisório.
Entre as limitações do estudo existe a ausência de uma amostra específica de apenas um setor
do comercio, o que poderia acarretar em melhor acurácia de acerto. Ademais, existe a
limitação por se ter trabalhado somente com dados de um ano antes da insolvência, sendo que
dados de 2 ou 3 anos antes da insolvência também poderiam apresentar resultados relevantes.
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
14
Como sugestão para estudos futuros recomenda-se o uso de dados específicos por setor do
comércio, períodos diferentes para seleção dos dados de empresas insolventes e também a
utilização de outras metodologias de modelagem para avaliação da solvência empresarial no
setor do comércio.
Referências
ASSAF NETO, A. Finanças Corporativas e Valor. 2. ed. São Paulo: Atlas, 2005.
BANCO CENTRAL DO BRASIL – BACEN. Relatório de Inflação. Brasília-DF: [s.n.], v.
17, nº 1, 2016 p. 1-151.
BORATTI, I. J. Tomada de decisão em relação ao crédito em uma instituição financeira:
um estudo de caso do banco do brasil. 2002. 152p. Dissertação (Mestrado em Administração
Pública), Fundação Getúlio Vargas, Rio de Janeiro, 2002.
CARVALHO, A. T. Modelo de previsão de insolvência para empresas comerciais. 2004,
129p. Dissertação (Mestrado em Engenharia de Produção) - Universidade Federal de Santa
Catarina, Florianópolis, 2004.
CORRAR, L. J. et al. Analise Multivariada: para os cursos de Administração, Ciências
Contábeis e Economia. São Paulo: Atlas, 2007.
GARSON, D. G. PA 765 statnotes: an online textbook. Disponível em:
<http//wwz.chass.ncsu.edu/garson/pa765/logistic.htm> Acesso em: 10 mar. 2016.
GUIMARÃES, I. A.; CHAVES NETO, A. Reconhecimento de Padrões: Metodologias
Estatísticas em Crédito ao Consumidor. RAE, v. 1, n. 2, 2002.
HAIR, J. F. et al. Análise multivariada de dados. 6. ed. Porto Alegre: Bookman, 2009. 688
p.
HOSMER JUNIOR, D. W.; LEMESHOW, S. Applied logistic regression. New York: J.
Wiley, 2004. 383 p.
MARTINS, G. A.; THEÓPHILO, C. R. Metodologia da investigação científica para
ciências sociais aplicadas. São Paulo: Atlas, 2009.
PRADO, J. W. et al. Multivariate analysis of credit risk and bankruptcy research data: a
bibliometric study involving different knowledge fields (1968-2014). Scientometrics,
Amsterdam, v. 106, n. 3, p. 1007-1029, 2016.
PRADO, J. W. Risco de crédito: uma abordagem utilizando análise discriminante, regressão
logística e redes neurais artificiais. 228 p. Dissertação (Mestrado em Administração) -
Universidade Federal de Lavras, Lavras, 2016.
SANTOS, J. O. Análise de crédito: empresas, pessoas físicas, agronegócio e pecuária. 5. ed.
XXXVI ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCÃO Contribuições da Engenharia de Produção para Melhores Práticas de Gestão e Modernização do Brasil
João_Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016. .
15
São Paulo: Atlas, 2012. 352 p.
SANVICENTE, A. Z.; MINARDI, A. M. A. F. Identificação de indicadores contábeis
significativos para previsão de concordata de empresas. Instituto Brasileiro de Mercado de
Capitais, Working Paper, Out. 1998.
SCHRICKEL, W. K. Análise de crédito: concessão e gerencia de empréstimos. 5. ed. São
Paulo: Atlas, 2000. 353 p.
SILVA, J. P. Análise Financeira de Empresas. 6. ed. São Paulo: Atlas, 2004.
SILVA, J. P. Gestão e Análise de Risco de Crédito. 6. ed. São Paulo: Atlas, 2008. 421 p.
SPEARMAN, C. General Intelligence Objectivelly Determined and Measured. American
Journal of Psychology, v. 15, p. 201-293, 1904.
VERGARA, S. C. Projetos e relatórios de pesquisa em administração. 9. ed. São Paulo:
Atlas, 2008. 94 p.
Top Related