Feedback

Application of data mining techniques to a selected business organization with special reference to buying behavior

Documento informativo
International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Mrs. Tejaswini Abhijit Hilage & Dr. R. V. Kulkarni. Assistant Professor, Department Of Management, Deshbhakt Ratnappa Kumbhar College Of Commerce, Kolhapur - 416002 tejaswini.hilage@gmail.com Professor & Head Of Department, Chh. Shahu Institute Of Business Education & Research Centre, Kolhapur – 416006 drrvkulkarni@siberindia.co.in ABSRTACT Data mining is a new concept & an exploration and analysis of large data sets, in order to discover meaningful patterns and rules. Many organizations are now using the data mining techniques to find out meaningful patterns from the database. The present paper studies how data mining techniques can be apply to the large database. These data mining techniques give certain behavioral pattern from the database. The results which come after analysis of the database are useful for organization. This paper examines the result after applying association rule mining technique, rule induction technique and Apriori algorithm. These techniques are applied to the database of shopping mall. Market basket analysis is performing by the above mentioned techniques and some important results are found such as buying behavior. KEYWORDS: Rule induction technique, Apriori algorithm, Market basket analysis, Association rule mining INTRODUCTION : Large databases maintained by retailers, telecom service providers & credit card companies contain very valuable information related to customers. These enterprises could benefit immensely in the areas of marketing, advertising and sales, if interesting and previously unknown customer buying and calling patterns can be discovered from the large volumes of data. Data mining helps marketing analysts to reflect actual behavior in different situations. Data mining is an attempt to source out pattern and trends in the data and infers rules from these patterns. With these rules the user will be able to support, review and examine decisions in some DOI: 10.5121/ijdms.2011.3413 169 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 related business and scientific area. This opens up the possibility of a new way of interacting with databases. An association rule is an expression of the form X=>Y, where X and Y are the sets of items. The goal is to discover all the rules that have the support & confidence greater than or equal to the minimum support and confidence respectively. Let L = {l1, l2, l3 lm} be a set of literals called items. Let D = database, be a set of transactions, where each transaction T is the set of items. T support an item x, if x is in T. T is said to support a subset of items x, if T supports each item x in X. Supports means how often X and Y occur together as a percentage of the total transactions. Confidence measures how much a particular item is dependent on another. Apriori is a classical algorithm and is designed to operate on databases containing transactions. The theory of Apriori algorithm is that “All nonempty subsets of a frequent itemset must also be frequent.” Apriori principle is shown as below: For all(x, y): (x belongs to y) => s(x) >= s(y). Apriori Algorithm is as follow: 1. Let K=1. 2. Generate frequent itemsets of length 1. 3. Repeat until no frequent itemsets are identified. Rule induction technique retrieves all interesting patterns from database. In rule induction technique, the rule is of “if this then this”. For example a rule that a supermarket might find in their data collected from scanners would be: “if pickles are purchased then ketchup is purchased’ Accuracy Low Accuracy High Coverage High Rule is rarely correct but can be used often. Rule is often correct and can be used often. Coverage Low Rule is rarely correct and can be only rarely used. Rule is often correct but can be only rarely used. REVIEW OF LITERATURE: Leonid Churilov, Adyl Bagirov, Daniel Schwartz, Kate Smith and Michael Dally [1] had already studied about combined use of self organizing maps & nonsmooth, nonconvex optimization techniques in order to produce a working case of a data driven risk classification system. Bagirov et al. [1] propose the global optimization approach to clustering and demonstrate how the supervised data classification problem can be solved via clustering. Anthony D Anna & Oscar H. 170 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Gandy [2] develop a more comprehensive understanding of data mining by examining the application of this technology in the marketplace. As more firms shift more of their business activities to the web, increasingly more information about consumers and potential customers is being captured in web server logs. Anthony D Anna & Oscar H. Gandy [2] examine issues related to social policy that arise as the result of convergent developments in e_business technology and corporate marketing strategies. Artificial neural networks are designed to model human brain functioning through the use of mathematics. Like neural network data mining through the use of decision tree algorithms discerns patterns in the data without being directed. According to Linoff “decision trees work like a game of 20 questions”, by automatically segmenting data into groups based on the model generated when the algorithms were run on a sample of the data (1998, p. 44). Decision tree models are commonly used to segment customers into “statistically significant” groups that are used as a point of reference to make predictions (Vaneko and Russo, 1999). Both neural networks & decision trees require that one knows where to look in the data for patterns, as a sample of data is used as a training device. The use of market basket analysis & clustering techniques does not require any knowledge about relationships in the data, knowledge is discovered when these techniques are applied to the data. Market basket analysis tools sift through data to let retailers know what products are being purchased together. Clusters prove to be most useful when they are integrated into a marketing strategy. Huda Akil, Maryann E. Martone, David C Van Essen [15] made a study about understanding the brain requires a broad range of approaches and methods from the domains of biology, psychology, chemistry, physics & mathematics. National Institute Of Health recently launched the Human Connectome Project and awarded grants to two consortia. The consortium led by Washington University of Minnesota aims to characterize whole brain circuitry & its variability across individuals in 1200 healthy adults. Neuroimaging & behavioral data from the HCP will be made freely available to the neuroscience community via a database & a platform for visualization & user friendly data mining. Chandrika Kamath [14] in her study said that the size & the complexity of the data from scientific simulations, observations and experiments becoming a major impediment to their analysis. To enable scientists to address this problem of data overload and benefit from their improved data collecting abilities, the Sapphire project team has been involved in the research, development & application of scientific data mining techniques for nearly a decade. According to her team the raw data available for analysis was in the form of images, structured or unstructured mesh data with physical variables at each mesh point or time series data collected by different sensors. They designed and built a software toolkit with separate modules for different tasks such as denoising, background subtraction to identify moving objects in video, dimension reduction to identify key characteristics of objects, pattern recognition for clustering and classification. Study made by Fadi Thabtah [13] about associative classification mining said associative classification integrates two known data mining tasks, association rule discovery and classification to build a model for the purpose of prediction. Another study is made by Tae Kyung Sung, Namsik Chang and Gunhee Lee about how data mining approach develop bankruptcy prediction model suitable for normal & crisis economic condition.The study made by HE Zengyou, XU Xiafei and DENG Shengchun [10] said that clustering is an important KDD technique with numerous applications, such as marketing & customer segmentation. 171 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 The aim of the study made by T. W. Rennie and W. Roberts [11] was to demonstrate the epidemiological use of multiple correspondence analyses as applied to tuberculosis (TB) data from North East Landon primary care trusts between the years 2002 & 2007 was used. TB notification data were entered for Multiple Corresponding Analysis allowing display of graphical data output. The study made by Shakil Ahmed, Frans Coenen and Paul Leng [4] consider strategies for partitioning the data to deal effectively. The study made by Balaji Padmanabhan & Alexander Tuzhilin [8] said previous work on the solution to analytical electronic customer relationship management problem has used either data mining or optimization methods, but has not combined the two approaches. By leveraging the strength of both approaches, the eCRM problems of customer analysis, customer interaction & the optimization of performance metrics can be better analyzed. By considering previous studies authors find out the scope to go for research in market basket analysis using three different algorithms namely Association Rule Mining, Rule Induction Technique and Apriori Algorithm. Authors will make a comparative study of three techniques and adopt the best conclusion. OBJECTIVES OF STUDY : In view of foregoing discussion & considering the nature of present study, the authors has laid down following objectives : To develop software which will perform market basket analysis using data mining techniques. To suggest suitable data mining tool which will help the organization. To understand customer buying behavior with the help of data mining technique and tools. To study how data mining tech. work while mining the data from data warehouse. DATA COLLECTION METHODS : Secondary Data : 1. Secondary data is collected from bills from the shopping malls. 2. Data is collected from periodic reports of shopping mall. DATA PRESENTATION AND DATA ANALYSIS :Here authors has develop and analyzed the large database of shopping mall. For presentation purpose authors has shown sample bills from the database and applied different data mining techniques as below. Data Presentation : Collected data is tabulated in transaction table : 172 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Transaction Table – Table No. 1 = Transaction ID Items 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Shabu, Parle G Parle G, Sunflower oil Shabu, Parle G, Sunflower oil, Pohe, Sugar, Rava, Dhoop Sunflower oil, Suger, Rava, Parle G Shabu, Maggi, Rava , Dhoop Rava Suger, Agarbatti Sunflower oil, Rava, Pen, Parle G Suger, Rava, Pen Shabu, Maggi, Agarbatti, Suger Shabu, Suger, Rava, Sunflower oil. Biscuit, Suger, Rava Sunflower oil, Pen, Chocolate Suger, Rava, Agarbatti Sunflower oil, Suger, Rava, Notebook Sunflower oil, Suger, Dhoop, Pohe. Select following items for calculation of association rules. Sunflower, Suger, Rava, Dhoop. COADING :Use binary 0 & 1. 0 indicate item is absent in the transaction 1 indicate item is present in the transaction. Input : Transaction Records : & Table No. 2 = Transaction ID Sunflower Suger Rava Dhoop 1 0 0 0 0 2 1 0 0 0 3 1 1 1 1 4 5 6 7 8 9 1 0 0 1 0 0 1 0 1 0 1 1 1 1 1 1 1 0 0 1 0 0 0 0 173 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 10 11 1 0 1 1 1 1 0 0 12 13 14 15 1 0 1 1 0 1 1 1 0 1 1 0 0 0 0 1 ANALYSIS 1. Analysis by Association Rule : In association rule support and confidence is calculated. Some minimum support and confidence is assumed. The rules which will satisfies the criteria of minimum support and minimum confidence will be true otherwise false. Support and confidence are calculated as below :Support (x -> y) = (Number of transactions containing x & y) / (Total no. of transactions.) Confidence (x -> y) = (Support of x -> y) / (Support of x) Assume minimum support = 50% and minimum confidence = 70 % Table No. 3 = Sr. Number X Y Support (%) Confidence (%) Is in rule? 1 Sunflower oil Suger 31 71 False 2 Sunflower oil Rava 31 71 False 3 Sunflower oil Dhoop 12 29 False 4 Suger Rava 56 75 True 5 Suger Dhoop 12 17 False Rava Dhoop 12 18 False 6 Following association rules are found:1. If sunflower oil then Suger For this rule support = 31 % & confidence = 71 %. The rule does not satisfies the criteria of minimum support, this rule is false. So we can say that when customer buys sunflower, he will not buy sugar. 2. If sunflower oil then Rava Here, 174 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Support = 31 %, confidence = 71. As it does not satisfies the criteria of min. support, the rule is false. So when customer buys sunflower oil, he will not buy rava. 3. If sunflower oil then Dhoop. Here, Support = 12 % and confidence = 29 %. The rule does not satisfies the criteria of minimum support and minimum confidence, so this rule is false. So when customer buys sunflower oil, he will not go for Dhoop. 4. If Sugar then Rava. Here, Support = 56 % and confidence = 75 %. Here, the rule satisfies both the criteria of minimum support and minimum confidence. So, the rule is true. Therefore when customer buys Sugar, he will buy Rava with 75% confidence. 5. If Sugar then Dhoop. Here, support = 12 % & confidence = 17 %. The rule does not satisfy the criteria of minimum support & min. confidence. So, this rule is false. Hence we can predict that when customer buys sugar, he will not buy Dhoop. 6. If Rava then Dhoop. Here, support = 12 % and confidence = 18 %. This rule does not satisfy the criteria of min. support & min. confidence. So, the rule is false. So we can predict that when customer buys Rava, he will not go for Dhoop. ANALYSIS BY RULE INDUCTION TECHNIQUE : In rule induction technique accuracy & coverage is calculated. Some minimum accuracy and coverage is assumed. The rules satisfying minimum accuracy and coverage is true otherwise false. Accuracy and coverage is calculated as below : Accuracy (x -> y) = (Number of transaction containing x and y) / (Number of transaction with x) 175 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Coverage (x -> y) = (Number of transaction containing x) / (Total number of transactions) Assume minimum accuracy = 50 % and minimum coverage = 70 %. Table No. 4 = Sr. Number 1 2 3 4 5 6 X Sunflower oil Sunflower oil Sunflower oil Suger Suger Rava Y Suger Rava Dhoop Rava Dhoop Dhoop Accuracy (%) 71 71 29 75 17 18 Coverage (%) 44 44 44 75 75 69 Is in rule? False False False True False False Following association rules are found: 1. If sunflower oil then Suger For this rule accuracy = 71 % & coverage = 44 %. As this rule satisfies the criteria of minimum accuracy but does not satisfies the criteria of minimum coverage, so this rule is false. So when customer buys sunflower, he didn’t go for sugar. 2. If sunflower oil then Rava Here, Accuracy = 71 %, coverage = 44%. As it satisfies the criteria of min. accuracy but does not satisfies the criteria of minimum coverage, this rule is false. So when customer buys sunflower oil, he didn’t go for rava. 3. If sunflower oil then Dhoop. Here, Accuracy = 29 % and coverage = 44 %. The rule does not satisfies the criteria of minimum accuracy and minimum coverage. So this rule is false. So when customer buys, he didn’t go for Dhoop. 4. If Sugar then Rava. Here, Accuracy = 75 % and coverage = 75 %. 176 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Here, the rule satisfies the criteria of minimum accuracy and minimum coverage. So, the rule is true. Therefore when customer buys Sugar, he will buy Rava with 75% confidence. 5. If Sugar then Dhoop. Here, accuracy = 17 % & coverage = 75 %. The rule does not satisfy the criteria of minimum accuracy, so this rule is false. Hence we can predict that when customer buys sugar, he didn’t go for Dhoop. 6. If Rava then Dhoop. Here, accuracy = 18 % and confidence = 69 %. The rule does not satisfy the criteria of minimum accuracy & minimum coverage. So, the rule is falses. So we can predict that when customer buys Rava, he will not go for Dhoop. ANALYSIS BY APRIORI ALGORITHM :The theory of Apriori algorithm is that prune the items with lowest support count until you get the one record with largest support count. Support count is calculated as below : Support count (x) = Number of transactions containing x. In Apriori algorithm two tables C and L are prepared. Support count is calculated for each item and recorded in C. In L the items having lowest support count is deleted. Prepare table C1 and L1 First C1: Table No. 5 = Item Sunflower oil Sugar Rava Dhoop Support count 7 12 11 3 In C1, Support count for Sunflower Oil = 7, that indicates there are 7 bills containing sunflower oil. Support count for Suger = 12, means there are 12 bills containing Suger. 177 International Journal of Database Management Systems ( IJDMS ) Vol.3, No.4, November 2011 Support count for Rava = 11, means there are 11 bills containing Rava. Support count for Dhoop = 3, indicate there are 3 bills which contains Dhoop. L1: Table No. 6 = Item Sunflower oil Suger Rava Support count 7 12 11 In L1, the items having lowest support count in C1, are deleted. (ie. Pruning process) Here, Dhoop are having lowest support count = 3. In L1 Dhoop is deleted. Hence, L1 contains Sunflower Oil, Suger & Rava with 7,12 and 11 com a ocorrência de raiva e leishmaniose visceral canina. Material e métodos Foram utilizados os resultados do censo canino e felino realizado em 1994 8 e os dados da coleta censitária de sangue para diagnóstico da leishmaniose visceral canina realizada na área urbana do município, entre janeiro e dezembro de 1999 (Centro de Controle de Zoonoses, Secretaria de Saúde e Higiene Pública. Boletins mensais das atividades de controle da leishmaniose visceral. Araçatuba, 1999-2004). Os dados de 2004 também foram obtidos por meio de censo canino realizado pelo Centro de Controle de Zoonoses (CCZ) da Secretaria de Saúde e Higiene Pública do município, no período de novembro de 2003 a março de 2004. Utilizou-se a divisão do município em oito áreas e 36 setores, divisão esta adotada pela Superintendência de Controle de Endemias (SUCEN) desde 1996, como padrão para as ações de saúde 9. Os dados de eutanásia canina foram obtidos dos boletins mensais das atividades de controle da raiva do Município de Araçatuba (Direção Regional de Saúde de Araçatuba, Secretaria de Estado da Saúde de São Paulo. Boletins das atividades de controle da raiva, Município de Araçatuba, 1993 a 2004). Para a comparação entre as faixas etárias da população canina consideraram-se os anos de 1994 e 2004, adotando-se o critério previamente utilizado em 1994 (< 1 ano; de 1 a 4 anos; > 4 anos). Como na coleta censitária de sangue de 1999 não houve registro da idade dos animais, a mesma não foi considerada para análise. Para a análise estatística utilizaram-se os testes do qui-quadrado e de duas proporções, adotando-se o nível de significância de 5% 10. Resultados e discussão A relação cão/habitante na área urbana de Araçatuba variou de 1,69 em 1994 para 2,03 cães em 1999, atingindo 1,79 cães para cada dez habitantes em 2004 (Tabela 1). O aumento observado no período pós-epidemia da raiva (1996 a 1998) reforça as observações de Beran & Frith 1 e Wandeler et al. 3 de que qualquer redução no tamanho da população canina por aumento na mortalidade é rapidamente compensada pelo aumento na reprodução e na taxa de sobrevivência. Quanto à distribuição sexual, houve diferença estatisticamente significante entre os períodos (p < 0,0001) com 56,2% de machos e 43,8% de fêmeas em 1994, passando a 51% e 49%, respectivamente, em 1999 e 49,9% e 50,1% em 2004. Embora na maioria dos estudos observese a predominância de animais do sexo masculino 2, em Araçatuba a predominância de machos observada em 1994 evoluiu para uma similaridade na distribuição entre os sexos, em 2004. As preferências da população que resultam na seleção de cães machos ou fêmeas são variáveis e sofrem influência de vários fatores econômicos e culturais, podendo ter influenciado os resultados observados na presente pesquisa. Observou-se também diferença estatisticamente significante (p < 0,0001) entre os anos de 1994 e 2004 para a distribuição da população canina segundo a faixa etária (Figura 1). A população de cães com até um ano de idade que representava 20,2% dos animais de 1994, passou a 32,5% em 2004 e a população de um a quatro anos de idade que era de 56,6% da população canina de 1994, diminuiu para 39,1% em 2004. Esse tipo de distribuição é típico de países do terceiro mundo e situações semelhantes foram observadas na Nigéria 11 e em Ibiúna, Estado de São Paulo 12. As implicações epidemiológicas dessa predominância de cães jovens incluem maior suscetibilidade a diferentes doenças e Tabela 1 Populações canina e humana na área urbana de Araçatuba, São Paulo, Brasil, e relação entre elas no período de 1994 a 2004. Ano Cães Habitantes Relação habitante/ cão Relação cão/ 10 habitantes * 1994 1999 2004 26.926 34.332 31.793 159.700 169.303 177.823 * Relação seguida de letras diferentes diferem entre si (p < 0,0001). 5,93 4,93 5,59 1,69 c 2,03 a 1,79 b Cad. Saúde Pública, Rio de Janeiro, 24(4):927-932, abr, 2008 ESTUDO DESCRITIVO DE UMA ESTRUTURA POPULACIONAL CANINA 929 Figura 1 Porcentagem de cães segundo a faixa etária na área urbana de Araçatuba, São Paulo, Brasil, nos anos de 1994 e 2004. baixa resposta imunológica frente a diversas vacinas contra importantes enfermidades, como a raiva 2,13. O número de eutanásias realizadas pelo CCZ declinou no período pós-raiva (1997 e 1998) e aumentou a partir de 1999 com a introdução da leishmaniose visceral (Figura 2). A taxa de eutanásia em 1994 foi de 8,8% (2.376/26.926); em 1999 foi de 14,9% (5.121/34.332) e em 2004 de 29,4% (9.364/31.793), diferenças estas estatisticamente significantes (p < 0,0001). Considerando-se o período de 11 anos, 49.380 cães foram submetidos à eutanásia no CCZ, sendo que deste total, 41.774 corresponderam ao período entre 1999 e 2004 (dados não apresentados). Ao contrário da raiva, cujas medidas de controle são amplamente eficazes, a enzootia de leishmaniose visceral no município não conta com meios de prevenção tão eficientes 14,15 e a alta taxa de eutanásia observada pode ter sido fator determinante para o decréscimo da população canina. Segundo Lima Júnior 2, elevadas taxas de mortalidade favorecem a renovação populacional o que pode resultar em população mais jovem e com maior tendência à prolificidade. Em Araçatuba, porém, a eliminação anual de um grande número de cães pode ter prejudicado seriamente o crescimento desta população uma vez que, mesmo havendo a reposição dos cães, muitos podem ter sido eliminados antes de atingirem a idade reprodutiva. A distribuição dos animais pela área urbana de Araçatuba revelou uma densidade de cães variável entre os diversos setores. Em 2004, por exemplo, os cães jovens com menos de dois anos de idade representaram 49,6% dos cães da área urbana (Figura 3). Os setores mais periféricos, com população de poder aquisitivo mais baixo, com mais problemas sociais e de saneamento ambiental, além de animais sem acompanhamento médico-veterinário, apresentaram alto percentual de cães menores de dois anos de idade (62% a 68%). Por outro lado, em setores economicamente mais desenvolvidos (região central), a porcentagem de cães com menos de dois anos de idade variou de 32,7% a 37,7%, sugerindo que a expectativa de vida dos cães destes setores é superior à dos periféricos. Os setores com maior porcentagem de animais jovens também apresentaram maior número de casos humanos de leishmaniose visceral e prevalência canina da doença (Centro de Controle de Zoonoses, Secretaria de Saúde e Higiene Pública. Boletins mensais das atividades de controle da leishmaniose visceral. Araçatuba, 1999-2004). Tal resultado é influenciado pela maior freqüência de ações de controle desenvolvidas nesses locais em decorrência dos casos humanos, resultando em maior taxa de eutanásia. Porém, o aumento da população canina mais jovem pode resultar em aumento da susceptibilidade destes cães à leishmaniose visceral, mantendo a doença na área. Cad. Saúde Pública, Rio de Janeiro, 24(4):927-932, abr, 2008 930 Andrade AM et al. Figura 2 Número de cães eutanasiados e existentes no período de 1994 a 2004 na área urbana de Araçatuba, São Paulo, Brasil. Figura 3 Porcentagem de animais de até dois anos de idade nos diferentes setores do Município de Araçatuba, São Paulo, Brasil, em 2004. São Paulo Cad. Saúde Pública, Rio de Janeiro, 24(4):927-932, abr, 2008 33% a 38% 38% a 46% 46% a 54% 54% a 62% 62% a 68% ESTUDO DESCRITIVO DE UMA ESTRUTURA POPULACIONAL CANINA 931 Conclui-se que a ocorrência de raiva e leishmaniose visceral influenciou na estrutura e composição da população canina da área urbana de Araçatuba, em decorrência das ações de controle aplicadas ao reservatório canino. Resumo Colaboradores No período de 1994 a 2004, a população canina de Araçatuba, São Paulo, Brasil, registrou duas importantes zoonoses: a raiva e a leishmaniose visceral. Analisaram-se as mudanças ocorridas nessa população durante esse período, utilizando resultados de censos caninos e de coletas censitárias de sangue realizados em 1994, 1999 e 2004. A relação cão/10 habitantes variou significativamente, passando de 1,7 em 1994 para 2,0 em 1999 e para 1,8 em 2004. A porcentagem de cães com até um ano de idade passou de 20% para 32,5% e o número de eutanásias realizadas também aumentou após 1999, com a introdução da leishmaniose visceral. O número de cães e a estrutura etária variaram nos diversos setores do município e aqueles com maior porcentagem de animais com até dois anos de idade apresentaram maior ocorrência de casos de leishmaniose visceral humana e canina. Tais resultados decorrem de ações de controle adotadas nos setores com casos humanos de leishmaniose visceral, porém, o aumento da população canina mais jovem pode resultar em aumento da susceptibilidade destes cães à doença, favorecendo a manutenção da mesma na área. A. M. Andrade contribuiu na coleta de dados, análise e interpretação dos resultados e elaboração do manuscrito. S. H. V. Perri colaborou na análise maior foco. No Brasil e no mundo os dados epidemiológicos demonstram que a epidemia avançou acometendo grupos sociais mais vulneráveis, estando os idosos entre estes 1,2. A expansão da AIDS, apesar das campanhas preventivas, é apontada em pesquisas como consequência de mudanças comportamentais impulsionadas pelo fenômeno da globalização, da massificação da notícia e da relativização de valores 5,6. É dito, ainda, que o aumento da infecção em idosos se deve a não assimilação/ adoção por parte desta população das medidas para o sexo seguro. Atualmente, medicamentos Cad. Saúde Pública, Rio de Janeiro, 29(10):2131-2135, out, 2013 CARACTERIZAÇÃO EPIDEMIOLÓGICA DOS CASOS DE AIDS 2133 Tabela 1 Distribuição dos casos de AIDS em pessoas com 60 anos ou mais, segundo as Gerências Regionais de Saúde (GERES) de Pernambuco, Brasil, 1998 a 2008. GERES 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 Total % I 12 11 9 15 21 15 20 27 18 15 20 183 62,5 II 0 0 0 0 0 1 0 0 1 0 0 2 0,7 III 0 1 1 0 0 0 0 0 1 0 0 3 1,0 IV 0 1 1 0 3 1 0 3 2 4 2 17 5,8 V 0 0 0 1 1 0 0 0 1 0 0 3 1,0 VI 0 0 0 0 0 0 0 1 0 0 0 1 0,3 VII 0 0 0 0 0 0 0 1 0 0 0 1 0,3 VIII 0 1 0 0 0 0 0 0 1 0 1 3 1,0 IX 0 0 0 0 1 0 0 0 1 0 0 2 0,7 X 0 0 1 0 0 0 0 0 0 0 0 1 0,3 XI 0 0 0 0 0 0 0 0 0 0 0 0 0,0 Pernambuco 12 14 12 16 26 17 20 32 25 19 23 216 73,7 Ignorado 0 0 9 8 10 7 7 2 15 19 0 77 26,3 Total 12 14 21 24 36 24 27 34 40 38 23 293 100,0 Fonte: Sistema de Informação de Agravos de Notificação (SINAN), 2010. Figura 1 Incidência dos casos de AIDS por 100 mil habitantes em pessoas com 60 anos ou mais, segundo ano de diagnóstico. Pernambuco, Brasil, 1998 a 2008. Fonte: Sistema de Informação de Agravos de Notificação (SINAN), 2010. que inibem a impotência sexual e a reposição hormonal fazem com que os idosos passem a ter uma vida sexual mais ativa, não utilizando, contudo, medidas preventivas por não se sentirem vulneráveis 6. Pesquisas brasileiras constatam o aumento de casos de AIDS em pessoas com menor escolaridade 7,8,9,10,11, ficando esta condição demonstrada neste estudo. A via heterossexual foi a categoria de maior expressão, reforçando que a prática sexual, sem proteção, constitui a mais importante via de transmissão também entre os idosos, denotando a necessidade de abordagens para o sexo seguro também para esta faixa etária. Chama a atenção o fato de não ter havido nenhum caso de UDI entre os idosos deste trabalho. Possivelmente, assumindo erroneamente que es- Cad. Saúde Pública, Rio de Janeiro, 29(10):2131-2135, out, 2013 2134 Silva MM et al. Tabela 2 Distribuição dos casos de AIDS em pessoas com 60 anos ou mais, segundo sexo, anos de estudos e categoria de exposição. Pernambuco, Brasil, 1998 a 2008. Variáveis 60-69 n% Faixa etária (anos) 70-79 80 e mais n%n% Sexo Masculino 159 54,2 33 11,3 Feminino 74 25,3 18 6,2 Anos de estudos Nenhum 19 6,4 3 1,0 1-3 38 13,0 6 2,1 4-7 28 9,5 7 2,4 8-11 21 7,1 2 0,7 12 e mais 20 6,8 3 1,0 Ignorado 107 36,5 30 10,2 Categoria de exposição Homossexual 15 5,1 3 1,0 Bissexual 10 3,4 2 0,7 Heterossexual 108 36,9 19 6,5 UDI 0 0,0 0 0,0 Ignorado 100 34,2 27 9,2 Total 233 79,5 51 17,4 UDI: usuários de drogas injetáveis. Fonte: Sistema de Informação de Agravos de Notificação (SINAN), 2010 3 6 1 1 2 0 1 4 2 0 4 0 3 9 1,0 2,0 0,3 0,3 0,7 0,0 0,3 1,4 0,7 0,0 1,4 0,0 1,0 3,1 Total n% 195 66,5 98 33,5 23 7,8 45 15,4 37 12,6 23 7,8 24 8,2 141 48,1 20 6,8 12 4,1 131 44,7 0 0,0 130 44,4 293 100,0 se grupo não é passível de tal comportamento, os profissionais de saúde não tenham investigado essa prática (no presente ou no passado) nessa população, embora seja essa abordagem um fator importante na investigação epidemiológica do caso 10,11. A ausência de casos em alguns anos deste estudo pode refletir a falta de diagnóstico, a subnotificação, atraso na investigação, denotando, todavia, baixa qualidade da informação coletada, sendo este um dos principais problemas da vigilância epidemiológica 12. Considerações finais O envelhecimento para ser experiência positiva exige independência e qualidade de vida, concebendo o exercício da sexualidade como natural e, portanto, inerente a essa população. A incidência de AIDS na população estudada faz supor que as campanhas de prevenção sobre HIV/AIDS e outras DST, até então realizadas, não estão atingindo eficazmente essa população. Faz-se necessário que campanhas específicas sejam pensadas e que os serviços de saúde abordem essa temática durante as consultas de rotina em atendimento aos idosos, possibilitando a prevenção primária. Para isso, é preciso capacitar profissionais, não só os envolvidos com a vigilância epidemiológica, mas, especificamente, os que assistem aos pacientes, para que atentem sobre a importância da informação. A confiabilidade, completude e atualização dos dados de notificação melhoram a qualidade e privilegiarão as tomadas de decisões. Cad. Saúde Pública, Rio de Janeiro, 29(10):2131-2135, out, 2013 CARACTERIZAÇÃO EPIDEMIOLÓGICA DOS CASOS DE AIDS 2135 Resumen Colaboradores Se están produciendo cambios en el escenario mundial durante los últimos años, debido a la reducción de las tasas de fecundidad y mortalidad, y como resultado, la longevidad se presenta como un fenómeno real. Durante la madurez, la sexualidad viene asociada a prejuicios más diversos. Este estudio caracteriza los casos de SIDA en personas de 60 años o más que vivían en el estado de Pernambuco, Brasil, y que se notificaron al Departamento de Salud de Pernambuco entre el 1 enero 1998 al 31 diciembre 2008. Se realizó un estudio transversal/ datos descriptivos con información del Sistema de Notificación de Resultados. En 1998, la tasa de incidencia del SIDA en la población estudiada fue de 1,6 casos por cada 100 mil habitantes, elevándose a 4,8 casos/100 mil habitantes en 2008, con un incremento del 200%. Es evidente la necesidad de desarrollo de la prevención, el diagnóstico y la asistencia dirigida específicamente a las personas mayores, ya que la sexualidad esa etapa de la vida, sigue rodeada de muchos tabúes y mitos. M. M. Silva, A. L. R. Vasconcelos e L. K. N. P. Ribeiro contribuíram na concepção do desenho, análise e interpretação dos dados, redação do artigo, e elaboraram e fizeram todas as correções necessárias até a aprovação da versão final. Agradecimentos Agradecemos ao Departamento de Saúde Coletiva, Centro de Pesquisas Aggeu Magalhães, Fundação Oswaldo Cruz e ao Núcleo de Epidemiologia da Secretaria Estadual de Saúde de Pernambuco, pelo incentivo à pesquisa e ao fornecimento de dados. VIH; Síndrome de Inmunodeficiencia Adquirida; Envejecimiento de la Población Referências 1. Brito A, Castilho E, Szwarcwald C. AIDS e infecção pelo HIV no Brasil: uma epidemia multifacetada. Rev Soc Bras Med Trop 2001; 34:207-17. 2. Ministério da Saúde. Curso básico de vigilância epidemiológica. Brasília: Ministério da Saúde; 2005. 3. Barbosa LM. A dinâmica da epidemia de AIDS nas regiões nordeste e sudeste [Tese de Doutorado]. Belo Horizonte: Universidade Federal de Minas Gerais; 2001. 4. Rede Interagencial de Informação para a Saúde. Indicadores básicos para a saúde no Brasil: conceitos e aplicações. 2a Ed. Brasília: Organização PanAmericana da Saúde; 2008. 5. Grangeiro A, Escuder M, Castilho E. Magnitude e tendência da epidemia de AIDS em municípios brasileiros de 2002-2006. Rev Saúde Pública 2010; 44:430-40. 6. Rodrigues LCB. As vivências da sexualidade de idosos [Dissertação de Mestrado]. Rio Grande: Universidade Federal do Rio Grande; 2008. 7. Rique J, Pinto KM. Perfil epidemiológico dos pacientes HIV/AIDS que abandonaram a terapia retroviral [Monografia de Graduação]. Recife: Faculdade de Enfermagem Nossa Senhora das Graças, Universidade de Pernambuco; 2001. 8. Rodrigues Jr. A, Castilho E. A epidemia de AIDS no Brasil, 1991-2000: descrição espaço-temporal. Rev Soc Bras Med Trop 2004; 37:312-7. 9. Pottes F, Brito A, Gouveia G, Araújo C, Carneiro R. AIDS e envelhecimento: características dos casos com idade igual ou maior que 50 anos em Pernambuco, de 1990 a 2000. Rev Bras Epidemiol 2007; 10:338-51. 10. Toledo L, Maciel E, Rodrigues L, Tristão-Sá R, Fregona G. Características e tendência da AIDS entre idosos no Estado do Espírito Santo. Rev Soc Bras Med Trop 2010; 43:264-7. 11. Perez B, Gasparini S. A vivência do idoso no processo de envelhecer e o HIV/AIDS: uma reconstrução dupla com suas possibilidades e limites. J Bras AIDS 2005; 6:106-9. 12. Gonçalves V, Kerr L, Mota R, Mota J. A Estimativa de subnotificação de casos de AIDS em uma capital do Nordeste. Rev Bras Epidemiol 2008; 11:356-64. Recebido em 06/Nov/2012 Versão final reapresentada em 10/Mai/2013 Aprovado em 05/Jun/2013 Cad. Saúde Pública, Rio de Janeiro, 29(10):2131-2135, out, 2013
Application of data mining techniques to a selected business organization with special reference to buying behavior
RECENT ACTIVITIES
Autor
Documento similar

Application of data mining techniques to a selected business organization with special reference to buying behavior

Livre