Novas tendências, o big data: deteção de fraudes e transações no comércio local: SAF-T com tecnologia big data
Contribuinte(s) |
Lopes, Eurico Ribeiro O'Neill, Henrique José da Rocha |
---|---|
Data(s) |
04/07/2016
04/07/2016
24/06/2016
|
Resumo |
Dissertação apresentada à Escola Superior de Tecnologia do Instituto Politécnico de Castelo Branco para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Desenvolvimento de Software e Sistemas Interactivos, realizada sob a orientação científica da categoria profissional do orientador Doutor Eurico Ribeiro Lopes, do Instituto Politécnico de Castelo Branco. A fraude e a evasão fiscal tem sido algo que as autoridades tributárias têm enfrentado arduamente nos últimos anos [49], com a adoção do e-fatura [48] em Portugal foi introduzido algum controlo das transações efetuadas entre o consumidor final e o comerciante, ficando tudo registado num ficheiro denominado SAF-T [26]. O projeto desenvolvido nesta dissertação consistiu no desenvolvimento de um protótipo que pretende detetar fraudes em vendas, stocks e controlo de inventários de produtos para comércios locais utilizando tecnologia no domínio do Big Data [5]. Foram utilizadas ferramentas na área do Big Data, em particular o ecossistema do Hadoop, nomeadamente o HDFS e o Hive. Este último permite o armazenamento, a consulta e a gestão dos dados. Com o auxílio destas ferramentas foi desenvolvido um protótipo onde são carregados ficheiros SAF-T gerados pelas máquinas registadoras que estão instaladas nos estabelecimentos, sendo os dados transformados num processo que será descrito na dissertação, para poderem ser manuseados com o Pentaho Report Designer [50]. A aplicação tem relatórios específicos que permite detetar determinados tipos de fraudes em vendas, existências de stocks e controlo de inventários de produtos para comércios locais. Destaca-se por exemplo o cruzamento de dados entre cliente (comerciante) e o retalhista para se poder confirmar a consistência entre o que é declarado por ambos, em auditorias se os bens (produtos) que o comerciante adquiriu, corresponde ao que foi faturado, bem como deteta se todos os produtos que são vendidos foram faturados, e que não houve evasão fiscal. Os dados que foram utilizados nos testes da ferramenta foram cedidos por um comerciante local e a ferramenta desenvolvida num portátil que prova que o Hadoop pode ser executado em máquinas sem ser necessário ter hardware de elevada qualidade. ABSTRACT: Fraud and tax evasion has been something that the tax authorities have faced hard in recent years [49], with the adoption of e-fatura [48] in Portugal was introduced some control of transactions between the consumer and the shopkeeper, getting all recorded in a file named SAF-T [26]. The project developed in this dissertation was the development of a prototype that aims to detect fraud in sales, stocks and control products inventories for local businesses using technology in the area of Big Data [5]. Tools have been used in the field of big data, in particular the ecosystem Hadoop, including HDFS, Map and Reduce hive. The Hive allows the storage of data, queries and management. With the help of these tools has been developed a prototype which are loaded SAF-T files generated by cash register that are installed in shops, data is transformed in a process that will be described in the dissertation, in order to be handled by reporting tool the Pentaho Report Designer [50]. The application have specific reports to detect certain types of fraud in sales, stock inventory and control of product inventory to local businesses. It stands out for example the exchange of data between client (shopkeeper) and retail to be able to confirm the consistency between what is declared by both, in audits if the goods (products) that the shopkeeper has corresponds to what was billed and detect whether all the products that are sold were invoiced for no tax evasion. The data that were used in the tool tests were provided by a shopkeeper and tool was developed in a laptop that proves Hadoop can run on machines without the need to have high quality hardware. |
Identificador |
http://hdl.handle.net/10400.11/5321 201204509 |
Idioma(s) |
por |
Direitos |
openAccess http://creativecommons.org/licenses/by-nd/4.0/ |
Palavras-Chave | #Big data #Hadoop #Business intelligence #SAF-T #Audit #Tax evasion #Auditoria #Evasão fiscal #Domínio/Área Científica::Ciências Naturais::Ciências da Computação e da Informação |
Tipo |
masterThesis |