Post on 25-Jul-2020
MODELO DE GESTÃO DE RISCOS A
PARTIR DA ANÁLISE ENVOLTÓRIA DE
DADOS (DEA)
Vitor Augusto Leivas Craveiro (UnB )
vitor.acraveiro@gmail.com
Paula Caminha Soares (UnB )
paulasoares91@gmail.com
Rodolfo Lisita Pinto (UnB )
rodolfolisita@gmail.com
Ana Carolina Nerva Blumm (UnB )
ana.blumm@gmail.com
Joao Carlos Felix Souza (UnB )
jocafs@unb.br
O artigo a seguir apresenta uma análise dos dados atípicos de uma
instituição que concede benefícios à população brasileira. Para este
estudo, é feito o uso de duas diferentes metodologias que se
complementam para identificação dos padrões desse risco operacional. A
primeira delas é a clusterização que, através do software SAS (Statistical
Analysis System), agrupa os dados considerando suas distâncias do
padrão. A segunda é a análise envoltória de dados (DEA) que ranqueia os
dados mais atípicos obtidos na metodologia anterior, analisando suas
eficiências relativas - a partir da maior eficiência, são calculadas as
eficiências dos demais dados. O banco de dados utilizado neste estudo
representa os indivíduos beneficiários da instituição analisada,
considerando o tipo de benefício recebido e a região geográfica dos
mesmos. Os resultados obtidos distinguem os indivíduos mais atípicos
dentro do banco de dados utilizados. Desta forma, o estudo a seguir refina
a amostra de indivíduos a ser analisada numa futura investigação de
campo, direcionando àqueles apresentados como mais atípicos.
Palavras-chaves: Clusterização, análise envoltória de dados, análise de
eficiência, gestão de riscos, risco operacional.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
2
Introdução
De acordo com Coimbra (2004), as empresas ou instituições atuais, independentes de seu
tamanho ou ramo de atividade, estão sujeitas a riscos. O risco é naturalmente associado a
qualquer situação adversa, perigo, algo que deve ser superado.
A organização analisada no presente projeto é uma instituição responsável pelos pagamentos de
benefícios aos trabalhadores brasileiros. Os serviços oferecidos pela empresa são prestados por
meio de agências de atendimento, localizadas em todo o território brasileiro.
Há, no entanto, uma diferença entre os valores dos benefícios que são concedidos por cada
agência. Nesse sentido, o estudo tem por objetivo encontrar potenciais dados atípicos nas
agências de atendimento, ou seja, encontrar os denominados “outliers” – observações
"anormais", contaminantes, estranhas ou extremas (FIGUEIRA, 1998).
Para obtenção de tais resultados, é feita uma análise do risco operacional a que a empresa está
submetida através da clusterização dos dados disponíveis. Será utilizado o software SAS
(Sistema de Análise Estatística), que identificará as características das regiões com maior
frequência de dados atípicos. Feito isso, será executada a metodologia DEA (Análise Envoltória
de Dados), que analisará os indivíduos de agencias com relação às suas eficiências, a partir dos
benefícios que cada uma concede e a quantidade de recursos que esta utiliza para concede-lo.
Essa análise ira gerar eficiência para todos os indivíduos clusterizados, possibilitando assim o
ranqueamento dos indivíduos. Os tópicos subsequentes detalham o procedimento realizado para a
obtenção dos resultados.
1. Fundamentação teórica
1.1. Gestão de riscos
A globalização, o aumento tecnológico e o aumento da competitividade fazem com que o
gerenciamento de risco seja cada vez mais imprescindível para as organizações. Segundo
Bernstein (1997), a genealogia do termo risco é ousar. Com isso, pode-se interpretar que o risco é
uma opção, envolvendo uma tomada de decisão, e suas decorrências influenciam o futuro das
empresas. Conforme Raff (2000) é necessário tomar essas decisões frequentemente no mundo
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
3
dos negócios e para isso os estudos dos riscos são cada vez mais aprofundados. De acordo com o
autor, os principais riscos empresariais internos podem ser categorizados em: estratégicos,
operacionais e financeiros.
O risco estratégico pode surgir de um desalinhamento entre o planejamento estratégico da
empresa e o resultado, ocorrido, por exemplo, de inovações tecnológicas inesperadas introduzidas
por organizações, no costume dos consumidores e na política regulatória (CARLTON, 1999). O
risco operacional é atrelado a falhas humanas, problemas de sistemas, falha na execução dos
procedimentos que podem impactar a produtividade. Por fim, o risco financeiro está associado à
volatilidade no mercado financeiro e, de acordo com Jorion (2004), decorre das oscilações nos
preços dos ativos com os quais a empresa trabalha, do risco do crédito que está submetida, ou do
risco de liquidez. O presente artigo tem como foco identificar dados atípicos de uma instituição
originados de possíveis riscos operacionais.
1.1.1. Riscos operacionais
Uma definição apropriada do risco operacional, como escrito anteriormente, é que ele é originado
por perdas decorrentes da inadequação, falhas nos processos internos de uma empresa, ações
humanas e sistemas. Culp (2001) acredita que os riscos operacionais surgem em função da
desatenção em processos, sistemas e, também, pelas falhas humanas no desempenho de
atividades. Segundo o mesmo autor, os pontos a seguir exemplificam os riscos operacionais:
- Pessoas: falta de conhecimento, erro de empregados, fraudes, perda de pessoal-
chave, disputa-legal com empregados;
- Processos: erros contábeis, riscos de projeto, erros aleatórios, risco de contrato;
- Sistemas: má qualidade dos dados, erros de programação, incapacidade do
sistema, falhas do sistema.
Os resultados a serem apresentados neste trabalho foram advindos por algum dos fatores
representados acima, assim tem-se como objetivo identificar as tendências e padrões das
atipicidades encontradas para facilitar com que a instituição mitigue esse risco.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
4
1.2. Análise envoltória de dados (DEA)
Os modelos clássicos de Análise Envoltória de Dados (DEA) foram introduzidos por Charnes et
al. em 1978 (baseada em retornos constantes em escala - CRS) e estendidos por Banker em 1984
(com retornos variáveis de escala - VRS), consistindo em uma metodologia não paramétrica para
mensuração comparativa da eficiência de unidades tomadoras de decisão (Decision Making Units
– DMU’s), com base nas melhores práticas. O conjunto de DMU’s deve ser homogêneo e ter em
comum a utilização dos mesmos inputs e a produção dos mesmos outputs.
Para que seja possível estudar a DEA, é necessário reforçar os conceitos e diferenciar eficiência e
eficácia. Eficiência encaixa-se no âmbito de comparação entre as variáveis de input (entrada) e
output (saída), sendo que a primeira fornece insumos ao processo e a segunda resulta na saída
dele, onde a maior eficiência caracteriza-se por menores valores de input e maiores de output.
Charnes et al. (1985) consideram que a unidade 100% eficiente é aquela que tem o maior
desempenho relativo dentro da amostra utilizada. Este raciocínio indica que existe uma
combinação técnica e alocativa ótima definida como eficiência. Eficácia é a capacidade de a
unidade produtiva atingir a produção que tinha como meta (Batista, 2007). A principal diferença
entre esses dois conceitos é que a eficiência considera os recursos utilizados para a caracterização
do processo ou indivíduo, e a eficácia avalia apenas se o objetivo foi alcançado.
1.3. Cluster
A clusterização é um processo de classificação não supervisionada de dados que resulta em
agrupamentos ou “clusters” (JAIN et al., 1999). Para Porter (1999), os clusters são
estabelecimentos correlatos dentro de uma determinada área que estão vinculados por elementos
comuns e complementares. Ou seja, um cluster é um agrupamento de semelhantes por
determinado aspecto.
O modelo de clusterização (Figura 1) neste estudo, basicamente, utiliza características pré-
selecionadas, em seguida mede a similaridade dessas características entre os cadastrados, separa-
os em grupos com particularidades próximas e, por fim, apresenta os grupos definidos.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
5
Fonte: GOMES, MOSCATO & VON ZUBEN (2004)
Nesse sentido, o fator que aglomera grupos de indivíduos que recebem benefícios destoantes dos
demais é que está sendo alvo do estudo. Esse fator caracteriza esses indivíduos, possivelmente
por ocorrer uma fraude ou erro de cadastro.
A forma como ocorre o agrupamento depende implicitamente do objetivo da análise, das
hipóteses criadas e da configuração inicial dos dados (DUBES & JAIN, 1976; FISHER & VAN
NESS, 1971). As maneiras mais utilizadas são as hierárquicas (Single Link e Complete Link) e as
particionais (Métrica Euclidiana – k-means–, Teoria dos Grafos, Mistura de Densidades –
Expectation Maximization).
2. Metodologia
A fim de encontrar possíveis atipicidades dentro da massa de dados, duas frentes de tratamento
de dados devem ser seguidas. A primeira é feita a clusterização dos dados com o auxílio do
software SAS. Com essa clusterização, foi possível encontrar dados que fogem do padrão dentro
do universo estudado. A segunda é a Análise Envoltória de Dados – DEA (Data Envelopment
Analysis) – a fim de ranquear os indivíduos pela eficiência relativa e identificar o padrão de
características que eles seguem diferente dos demais. O DEA (Data Envelopment Analysis) é
uma metodologia que analisa de maneira multidimensional a partir da definição de alguns
parâmetros para criar eficiência relativa para todos os dados analisados:
Figura 1 - Processo de clusterização
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
6
- Identificação – para que se possa fazer o rastreamento de informações dentro de
um complexo algoritmo, existem alguns campos de identificação das variáveis no sistema que
ficam visíveis até a etapa final do algoritmo;
- DMUS – representam a quantidade de informações que serão processadas. Em
termos práticos, é o número de linhas que estão sendo fornecidas ao sistema.
- Inputs – representam as entradas do processo de concessão do benefício;
- Outputs – representam as saídas do processo de concessão de benefícios.
3. Apresentação dos dados
Tanto para a clusterização, quanto para a análise envoltória de dados, foram utilizadas as
informações fornecidas pela própria instituição em questão. Foram disponibilizados dados de três
benefícios diferentes, suficiente para que esse estudo fosse realizado.
A empresa em foco tem por objetivo oferecer benefícios que garantem tranquilidade aos
trabalhadores brasileiros. Para isso, ela conta com aproximadamente 1200 unidades de
atendimento responsáveis por esclarecer dúvidas, conceder e manter os benefícios de seus
contribuintes.
Cada benefício concedido é tratado como uma espécie dentro da organização. Para cada espécie,
há um banco de dados de seus beneficiários, que ultrapassam 19 mil e que são classificados
através de 80 variáveis. Portanto, pela numerosa quantidade de dados, este banco por espécie é
considerado extenso e complexo.
Devida à grande extensão territorial brasileira e à sua dispersão populacional, a empresa em
questão agrupa o gerenciamento de suas agencias de atendimento em cinco regiões. São elas:
- São Paulo;
- Minas Gerais, Rio de Janeiro e Espírito Santo;
- Estados da Região Sul;
- Estados da Região Nordeste;
- Estados da Região Norte, Centro-Oeste e Distrito Federal.
Esta divisão também foi adotada para identificar os dados utilizados.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
7
Para o estudo, foram considerados apenas três dos diversos benefícios possíveis de serem
concedidos. Todos eles envolvem pagamentos de taxas mensais aos beneficiários, ou seja, geram
gastos que potencializam a possibilidade de desvios.
4. Análise dos Resultados
4.1. Cluster
No estudo, realizaram-se clusters para as três espécies de benefícios. Para que os clusters sejam
feitos, o banco de dados de entrada é filtrado, a fim de obter a separação por sexo e por zona de
habitação dos indivíduos, ou seja, urbano/rural e masculino/feminino. Feito isto, utiliza-se a
Métrica Euclidiana k-means para agrupar os dados de 8 em 8 grupos. O motivo de gerar oito
grupos é pela prévia divisão de tamanho máximo de grupos toleráveis.
A separação dos grupos foi resultante de uma semelhança entre o valor bruto do benefício
recebido pelos indivíduos que frequentam as agências. Apenas alguns dos clusters foram
selecionados para continuar o estudo – aqueles que possuíam um valor bruto médio recebido por
individuo destoante dos demais clusters. Estes clusters destoantes geram os dados atípicos e
foram originados possivelmente por erro de cadastramento ou fraude.
A análise a seguir distribui estes dados atípicos de acordo com sua localização, com seu sexo e
com a zona habitacional. Primeiramente, o gráfico a seguir representa a porcentagem de dados
atípicos encontrados em cada região.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
8
Figura 2 - Gráfico de tendência
Fonte: Elaborado pelos autores (2013)
Os valores representam a razão entre a quantidade de dados atípicos e a quantidade de indivíduos
naquela região, evidenciando a probabilidade de se encontrar maior número de casos atípicos em
cada uma dessas localizações.
Visualizando o gráfico, é possível identificar que os estados de Minas Gerais, Espirito Santo e
Rio de Janeiro possuem a segunda maior chance de ocorrer casos atípicos. Em contraponto, esta
região é a segunda menor em indivíduos cadastrados, justificando a alta probabilidade de
ocorrência de perdas operacionais e identificando probabilidade de risco.
A tabela 1 apresenta as quantidades e distribuições das informações a respeito do sexo e da zona
de habitação dos registros considerados atípicos.
Tabela 1 - Categorização dos dados atípicos
Fonte: Elaborado pelos autores (2013)
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
9
A análise da tabela 1 mostra que, na maioria, as mulheres estão ligadas às atipicidades
encontradas, independente da zona em que vivem. Avaliando estes resultados por região, temos:
São Paulo
Segundo o IBGE (2011), o estado de São Paulo possui 49% de sua população composta por
homens e, logo, 51% de mulheres. Diante destes valores, esperava-se que na tabela fosse
encontrada uma proporção semelhante. No entanto, nota-se que o valor para mulheres representa
aproximadamente 40% dos dados atípicos e 60% para homens. Outro fator em destaque, é que o
estado tem apenas 6% da sua população habitando o meio rural (IBGE, 2011). Porém, ao analisar
a tabela, visualiza-se que para ambos os sexos o valor de dados atípicos no meio rural é superior
ao meio urbano. Estas duas características são indicativas de anormalidade que pode configurar
fraude.
MG, RJ, ES; Região Sul; Norte e Centro-Oeste
As três regiões podem ser analisadas em conjunto, já que possuem características semelhantes.
De acordo com o IBGE (2011), estes estados têm em média 85% de sua população urbana e 10%
rural. Contudo, a tabela 1 evidencia quase 50% de dados atípicos na zona rural. Esse fato ratifica
anomalias.
Nordeste
De acordo com o IBGE (2011), a região nordeste tem cerca de 50% da sua população masculina
e 50% feminina. Entretanto, os dados obtidos refletem que 77% dos registros atípicos são de
mulheres, não obedecendo a proporcionalidade esperada pelo senso consultado. Outra evidência
de risco operacional, é que a região possui 73,1% de sua população urbana; embora os resultados
obtidos expressem um quantitativo com cerca de 50%.
4.2. Análise envoltória de dados
Para utilizar a metodologia DEA, deve-se primeiro definir as variáveis de identificação, de input
e de output. Para realizar este trabalho, as seguintes variáveis foram utilizadas:
Variáveis de identificação
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
10
As variáveis de identificação refletem as características que definem os indivíduos considerados
atípicos pela análise apresentada anteriormente.
- Espécie: indica qual o tipo de benefício é concedido ao usuário. Com ela, é
possível saber quais benefícios são potencialmente mais suscetíveis à fraude;
- Sequencial:corresponde ao número de identificação do beneficiário da instituição
analisada. Ela tem a funcionalidade de diferenciar um indivíduo de outro;
- Localização geográfica: identifica a região do Brasil em que o indivíduo se
encontra. Ela indica o lugar em que o benefício é concedido e, consequentemente, a
tendência de dados atípicos por localidade brasileira;
- Sexo: classifica o indivíduo em masculino ou feminino. Esta classificação permite
a análise dos resultados pela tendência comparativa entre homens e mulheres.
Variáveis de input
As variáveis de input são as variáveis que atuam como entrada do processo de concessão de
benefícios.
- Data relativa: Considerando o princípio de eficiência do DEA – baixos valores de
entrada e altos valores de saída – deve-se criar uma nova variável de input que atenda tal
requisito. Esta variável é definida a partir das variáveis originais: Data de Nascimento dos
Beneficiários e Data de Início do Benefício. Primeiramente, estas datas foram
transformadas em números inteiros, a partir da data 01/01/1900 (padrão do Excel). Por
exemplo, se existir um número “2” nesse input de entrada do DEA, esse dado corresponde
à data 02/01/1900, o número “3” corresponde à data 03/01/1900, e assim sucessivamente.
Quanto menor a diferença entre os valores correspondentes à Data de Nascimento e à
Data de Início do Beneficio, menor era a idade da pessoa quando começou a receber o
benefício. Esta comparação de datas é explicitada pela fórmula (1):
(1)
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
11
A análise desta fórmula indica que quanto menor o valor obtido, mais jovem é o indivíduo
em questão.
Uma vez que o DEA indica como potencial fraude os dados que possuem o input
pequeno, é necessário adequar esse resultado para que o conceito de eficiência do DEA
permaneça. Então, para a data relativa ser considerada input, foi utilizado a seguinte
adaptação da equação (1):
(2)
,
O resultado obtido sendo pequeno indica duas datas próximas, o que acarreta na
caracterização de uma perda operacional.
- Valor da renda mensal inicial: representa o valor que o indivíduo recebedor
ganhava mensalmente antes de se tornar um beneficiário. Esta variável é relevante por
representar a discrepância entre o valor inicial e final da renda, podendo encontrar
indivíduos que tiveram crescimentos de renda atípicos.
Variáveis de output
As variáveis de output são as variáveis que atuam como saída do processo de concessão de
benefícios.
- Valor bruto: esta variável se refere à quantia paga aos beneficiários sem nenhum
abatimento. Com isso, ela pode apontar uma discrepância nos recebimentos de benefícios
entre os indivíduos considerados.
- Crescimento da renda mensal: a variável é obtida através da relação entre o valor
da renda mensal inicial somado ao seu reajuste. Após tal soma, o valor obtido é dividido
pela renda mensal inicial visando obter a proporção de crescimento do valor recebido pelo
indivíduo. Porém, por se tratar de porcentagem, é necessário subtrair tal divisão por um,
visando encontrar somente o crescimento. A equação (3) expressa a função:
(3)
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
12
Com essas variáveis e a partir dos resultados obtidos na clusterização, fez-se a análise DEA. Esta
análise teve como objetivo ranquear os dados já considerados atípicos pela clusterização de
acordo com sua eficiência relativa, ou seja, sua potencialidade de perda por fraude. O ranque
pode direcionar a apuração ou não de fraudes em uma ordem decrescente de certeza, além de
auxiliar a empresa a investigar os indivíduos que apresentam dados destoantes e criar uma rotina
de controle para evitar este cenário novamente.
Com o ranque é possível evidenciar uma relação entre as variáveis de input e output que conduz a
uma maior probabilidade de risco. A fim de legitimar o algoritmo realizado pelo software,
realiza-se uma análise amostral (aproximadamente 10% do universo) manualmente nos
resultados para verificar sua consistência. Calcula-se a média dos valores de input e de output dos
14 primeiros e 14 últimos DMU’s do ranque. Esta análise comprova que de fato o algoritmo
acusa como eficiente os DMU’s com valores baixos de input e valores altos de output. A tabela 2
abaixo representa tais médias:
Tabela 2- Médias entre inputs e outputs
Fonte:
Elaborado pelos autores (2013)
Com o resultado obtido, é possível classificar todos os 280 indivíduos considerados atípicos. A
tabela 3 abaixo apresenta os primeiros 50 indivíduos desse ranque:
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
13
Tabela 3 - Ranque dos primeiros 50 indivíduos atípicos
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
14
Resultado DEA
Ranking Nº de identificação DMU Valor Bruto Crescimento Data Relativa Valor da Renda Inicial Eficiência
1 193640 292896 0,07757601 0,01970661 37756,00 1,000000
2 12904 479600 0,28865483 0,38719434 16615,00 1,000000
3 82030 664723 0,51227112 0,66158099 12976,00 1,000000
4 197258 328652 0,46670264 0,79843142 7042,00 1,000000
5 197929 508404 0,57066337 0,74465463 8909,00 1,000000
6 163461 458120 0,01372283 0,44281130 210845,00 1,000000
7 147667 485823 0,51123119 0,66809863 9503,00 0,993629
8 195390 691536 0,37689994 0,47306146 18348,00 0,982390
9 136062 274158 0,08263204 0,18343836 33172,00 0,971540
10 174504 344967 0,46705524 0,73992958 7386,00 0,968516
11 190628 397574 0,48617341 0,76563485 8177,00 0,925656
12 117038 344700 0,12118123 0,27883275 28445,00 0,904286
13 197217 468585 0,47131865 0,71515343 9942,00 0,857718
14 197928 593360 0,36411389 0,53368054 16296,00 0,855758
15 188383 206700 0,34181939 0,82636915 6046,00 0,853069
16 1091 338408 0,11993054 0,29294878 28217,00 0,852718
17 188893 444458 0,44592957 0,71309729 9967,00 0,813754
18 34028 339528 0,41134965 0,69475981 8254,00 0,777497
19 197464 413864 0,20823346 0,43105373 19875,00 0,770810
20 196827 341345 0,41135816 0,76239835 8298,00 0,766527
21 195368 456747 0,28793230 0,54403564 15863,00 0,762833
22 1498 94600 0,21828868 0,87722233 4330,00 0,760675
23 3989 334693 0,12487948 0,33933194 26800,00 0,748909
24 20471 356284 0,15369229 0,39709708 23178,00 0,705230
25 413 258985 0,10538127 0,28131945 24576,00 0,689475
26 193728 371127 0,38197509 0,72191534 9716,00 0,688201
27 126296 393541 0,26720600 0,49008067 14728,00 0,684561
28 81869 378063 0,19876084 0,35073048 19021,00 0,677288
29 187017 361330 0,31950659 0,61124098 11309,00 0,672538
30 187738 342428 0,37224481 0,73430956 9199,00 0,660974
31 10306 384190 0,35224168 0,72752935 10907,00 0,651786
32 194277 336256 0,14418593 0,41677087 23321,00 0,636790
33 48428 323080 0,20206392 0,44252293 15989,00 0,623693
34 123539 322083 0,13497171 0,40736602 23863,00 0,621238
35 194920 335941 0,17077787 0,43515594 19669,00 0,620766
36 180611 335652 0,25063620 0,51683083 13392,00 0,614192
37 191591 358954 0,31086343 0,66662817 11547,00 0,601499
38 191873 158492 0,24694921 0,81597133 6418,00 0,595070
39 193380 323254 0,14584642 0,44276556 22164,00 0,582116
40 157072 359705 0,20362581 0,54964946 17665,00 0,578883
41 199200 359210 0,29041151 0,64538417 12369,00 0,578133
42 30085 325909 0,14173535 0,47812304 18273,00 0,572070
43 10769 347909 0,19413481 0,54991587 17921,00 0,557400
44 24701 321848 0,15160057 0,46698469 21230,00 0,553936
45 43527 287379 0,13240831 0,41433930 21704,00 0,550799
46 178505 286096 0,08789522 0,14183630 32545,00 0,549139
47 79582 330497 0,15985311 0,54985692 16202,00 0,544604
48 93182 350287 0,22186914 0,60413219 15788,00 0,541782
49 189035 330991 0,27614801 0,65689586 11986,00 0,541168
50 199326 332900 0,15490939 0,56557100 16719,00 0,532860
OUTPUT INPUT
Fonte:
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
15
Elaborado pelos autores (2013)
O histograma representado na Figura 3 agrupa todos os 280 indivíduos por sua classificação no
ranque.
Figura4 – Eficiência dos dados atípicos
Fonte: Elaborado pelos autores (2013)
O eixo X do histograma representa o número de ocorrências encontradas e o eixo Y representa
valores de eficiências em um determinado intervalo.
Deve-se frisar que todos os indivíduos apresentados no gráfico acima já possuem características
incomuns do padrão do banco de dados disponível, por terem sido clusterizados anteriormente.
Contudo, entende-se que a grande maioria dos dados atípicos apresenta uma divergência mais
amena em relação aos potencialmente mais atípicos, diminuindo gradativamente o número de
indivíduos conforme aumenta o valor DEA.
5. Conclusão
A gestão de riscos é primordial para garantir que uma empresa atinja seus objetivos sem enfrentar
adversidades não esperadas. Embora a teoria desta gestão possa parecer relativamente simples,
sua principal premissa é a identificação das perdas e consequentemente dos riscos em que a
organização está imposta, o que requer o uso de ferramentas, metodologias e técnicas adequadas.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
16
Apesar da complexidade dos riscos serem variáveis, este artigo aborda um conjunto de
metodologias para melhorar a sua identificação, independente da sua origem e nível.
Assim, essas metodologias podem ser aplicadas em qualquer âmbito empresarial.
Especificamente para este estudo, o resultado aponta provavelmente possíveis fraudes ou falhas
de cadastro, o que varia de acordo com a realidade da empresa. A gestão de riscos é um processo
dinâmico, com isso deve-se sempre buscar instrumentos e ferramentas estatísticas paramétricas e
não paramétricas para modelos de controle que propiciem ações efetivas para sua mitigação.
REFERÊNCIAS
BANKER, R. D. Estimating most productive scale size using Data Envelopment Analysis.
European Journal of Operational Research, v. 17, p. 35-44, 1984.
BATISTA, D.; CARVALHO, A. Avaliação do desempenho operacional de uma serraria
através de estudo de tempo, rendimento e eficiência. Scientia Forestalis, v. 75, p. 31-38, 2007.
BERNSTEIN, P. L. Desafio aos Deuses: a Fascinante História do Risco. Rio de Janeiro:
Campus, 1997.
CARLTON, T. Risk and capital management in non-financial companies. Risk and Capital
Management Conference Proceedings, Australian Prudential Regulation Authority, 1999.
CHARNES, A.; COOPER, W.; RHODES, E. Measuring the efficiency of decision making
units. European Journal of Operational Research, v. 2, p. 429-444, 1978.
CHARNES, A; CLARK, W.; GOLANY, B. A developmental study of data envelopment
analysis in measuring the efficiency of maintenance units in the US air forces. Thompson and
R.M. Thrall, Eds., Annals Of Operation Research, v.2, p. 95-112, 1985.
COIMBRA, F. Gestão Estratégica de Riscos: Instrumento de Criação de Valor. Seminário
Nacional de Educação à Distância, 7, 2004. Anais… São Paulo: Universidade de São Paulo, 2004.
CULP, C. L. Risk Transfer Derivatives in Theory and Practice. USA: Wiley, 2001.
XXXIII ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Gestão dos Processos de Produção e as Parcerias Globais para o Desenvolvimento Sustentável dos Sistemas Produtivos
Salvador, BA, Brasil, 08 a 11 de outubro de 2013.
17
DUBES, R.; JAIN, A. Clustering Techniques: The User’s Dilemma. Pattern Recognition, v. 8, p.
247-260, 1976.
FIGUEIRA, M. Identificação de Outliers. Millenium - Revista do Instituto Politécnico de Viseu,
Portugal, v. 1, n. 12, out. 1998. Disponível em: http://www.ipv.pt/millenium/arq12.htm. Acesso
em: 13 de mar. 2013.
FISHER, L.; VAN NESS, J. Admissible Clustering Procedures. Biometrika, v. 58, p. 91-104,
1971.
GOMES, L.C.T. ; VON ZUBEN, F. J. ; MOSCATO, P. A Proposal for Direct-Ordering Gene
Expression Data by Self-Organising Maps. Applied Soft Computing (Print), 2004.
INSTITUITO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Primeiros Resultados
Definitivos do Censo 2010: população do Brasil é de 190.755.799. Disponível em:
http://saladeimprensa.ibge.gov.br/noticias?view=noticia&id=1&busca=1&idnoticia=1866.
Acesso em: 20 de mar. 2013.
JAIN, A., MURTY, M. & FLYNN, P. Data Clustering: A Review, ACM Computing Surveys, v.
31, n. 3, p. 264-323, 1999.
JORION, P. Value at Risk. 2º ed. São Paulo: BM&F, 2004.
PORTER, E. M. Competição – Estratégias competitivas essenciais. 7ª Edição. Rio de Janeiro:
Editora Campus, 1999.
RAFF, D. M. G. Risk Management in an Age of Change. Philadelphia: Wharton School,
University of Pennsylvania, 2000.
SAS THE POWER TO KNOW. Soluções: fraudes e crimes financeiros. Disponível em:
http://www.sas.com/offices/latinamerica/brazil/solucoes/fraude.html. Acesso em: 18 de mar.
2013.