Подходы к моделированию отбора налогоплательщиков для проведения выездных налоговых проверок и налоговых поступлений в аспекте изучения зарубежного опыта Кошурко А.Н., Феей на Е.Л.

д.э.н., профессор; GPhD в области экономики, full professor кафедры ЭММ ИУЭиФ К(П)ФУ

В рыночной экономике налоговая система является одним из факторов ее стабилизации и развития. Позитивное развитие этого процесса сдерживает такое общественное явление, как уклонение от уплаты налогов. Сокрытые от налогообложения средства нередко уходят в «теневой» оборот, начинают работать на криминальные структуры, порождая коррупционные явления. Аналитические данные правоохранительных органов России свидетельствуют о том, что на протяжении последних 10 лет около 50-60% от общего числа налогоплательщиков (юридических и физических лиц) не осуществляли или не в полной мере осуществляли налоговые выплаты в бюджет [2].

За 2016 г. правоохранительные органы России расследовали около 70 тыс. уголовных дел о налоговых преступлениях и привлекли к уголовной ответственности более 19 тыс. физических лиц. Только в 2015 г. количество уголовных дел, находившихся в производстве правоохранительных органов России по борьбе с налоговыми преступлениями, составило более 65 тыс. [5]. Таким образом, перелома в правовом сознании налогоплательщиков не произошло и уровень профилактической работы по предупреждению налоговых правонарушений и преступлений следует признать неудовлетворительным. В этих условиях первостепенное значение должно быть уделено аналитическим процедурам контроля за налоговой дисциплиной в сфере экономики.

К одному из важнейших видов налогового контроля относятся выездные налоговые проверки налогоплательщиков. По ряду оценок такие проверки дают до 20% дополнительных налоговых начислений и служат средством для воспитания налоговой законопослушности хозяйствующих субъектов [6]. В статистической практике налоговые органы предпочитают использовать одновременно несколько методов отбора налогоплательщиков для проведения выездных налоговых проверок. Цель такого выбора заключается в поиске потенциально наиболее «продуктивных» случаев, то есть таких налогоплательщиков, проверка которых приведет к наибольшему объему доначислений. Специалисты налоговых органов признают также важность обеспечения некоторого минимального уровня охвата документальными проверками всех групп налогоплательщиков, в том числе и тех, которые в прошлом исправно платили свои налоги.

Самым простым методом отбора налогоплательщиков для проверки является случайный выбор. Однако по сравнению с другими методами отбора он дает мало дополнительных начислений. Чаще всего случайный отбор применяется для построения выборки налогоплательщиков по которой судят о характеристиках генеральной совокупности, в частности, о том, какова степень ухода от налогов на данной территории или среди каких категорий налогоплательщиков особенно высок процент случаев уклонения от выполнения налоговых обязательств.

В частности, Федеральное налоговое управление США периодически проводит тщательную проверку случайным образом отобранных деклараций физических и юридических лиц с привлечением информации из внешних источников. Это делается в рамках специальной программы, которая называется «Измерение законопослушности налогоплательщиков» (ТСМР -Taxpayer Compliance Measurement Program) [9]. По результатам таких проверок строятся оценки, показывающие степень ухода от налогов в генеральной совокупности налогоплательщиков. Разрабатываются также критерии отбора налоговых деклараций по которым можно ожидать наиболее высокий уровень начислений.

Аналогичную программу «Процессуальный контроль» (Processing Review) имеет Государственная налоговая служба Канады [16]. В рамках этой программы случайным образом выбираются декларации физических лиц, указавших, что часть их совокупного дохода должна облагаться налогом по льготному режиму или вообще не подлежит налогообложению. Все попавшие в выборку декларации тщательно проверяются на обоснованность предоставленных льгот. По результатам этих проверок строятся оценки степени распространения случаев ухода от налогов в разрезе конкретных налоговых льгот. Соответственно и критерии направленного выбора распространяются только на тех налогоплательщиков, которые претендуют на получение льгот.

Главное отличие между канадской и американской программами заключается в том, что канадская программа предполагает проверку лишь одного или нескольких конкретных пунктов, указанных налогоплательщиком в декларации, тогда как американская программа предусматривает полную проверку всех пунктов декларации.

Важным достоинством программы проверки случайным образом выбранных налогоплательщиков является то, что полученные результаты образуют определенный эталон, с которым можно сравнивать эффективность методов направленного отбора. По имеющимся данным средняя сумма доначислений на одну декларацию при проверке случайной выборки налогоплательщиков в США занятых в малом и среднем бизнесе в рамках программы «Измерение законопослушности налогоплательщиков» составила в первом квартале 2015 г. в среднем 569 долл., а проверка тех же налогоплательщиков отобранных неслучайным направленным образом в среднем дает 8,6 тыс. долл, доначислений на каждый проверенный случай [9]. Это расхождение свидетельствует об эффективности идентификации продуктивных случаев при направленном выборе налогоплательщиков.

В Канаде ежегодно проверяется около 250 самых крупных корпораций, включая примерно 7 тыс. корпораций попадающих в сферу контроля крупных корпораций или связанных с ними каким-то иным способом. Ежегодным контролем охватывается от 30 до 40% крупных корпораций, чей годовой оборот превышает 15 млн. канадских долл., что приносит в казну в среднем около 60% дополнительных начислений [10].

Однако практика проведения налоговых проверок в зарубежных странах свидетельствует о значительном снижении налоговой дисциплины, прежде всего, среди мелких налогоплательщиков. Несмотря на то, что доначисления по крупным налогоплательщикам обеспечивают большие поступления в казну, потери от мелких и средних налогоплательщиков со временем могут перевесить этот выигрыш [12].

Довольно распространенным методом отбора является проверка тех категорий налогоплательщиков предыдущие проверки которых позволили выявить значительное сокрытие доходов (налоговой базы). В простом случае этот подход может предполагать повторную проверку всех тех налогоплательщиков, у которых в недавнем времени были большие доначисления по результатам проверок. Можно также выборочно проверить предприятия, относящиеся к какой-либо конкретной отрасли или физических лиц определенной профессии, если предыдущие проверки показали, что масштабы ухода от налогов среди предприятий этой отрасли или лиц определенной профессии весьма значительны.

Используется также более сложный вариант этого метода, получивший название сотовой системы. При этой системе все налогоплательщики разбиваются на ряд классов (ячеек) по отраслевому признаку, а внутри каждой отрасли по объему продаж. Затем с помощью экономико-статистического анализа определяются те ячейки, по которым за последние годы были получены самые большие в среднем на одно предприятие доначисления. Проверке таких ячеек в будущем уделяется наибольшее внимание.

Источники наводящей информации могут быть разные, например, данные полученные в ходе проверок других предприятий. Допустим, что в ходе проверки правильности уплаты налога на прибыль одним из предприятий налоговые органы обнаружили информацию, указывающую на то, что данное предприятие неправильно начислило НДС или проверка показала, что юридическое (физическое лицо) участвовало в подозрительных сделках с другими юридическими (физическими) лицами.

Другим источником наводящей информации являются «сигналы» о недобросовестных налогоплательщиках, которые могут поступать от недоброжелателей, соседей. Иногда такой информацией обмениваются между собой специалисты налоговых органов, проверяющие своих налогоплательщиков и обнаруживших некоторую закономерность того, что налогоплательщики определенного типа часто допускают нарушения налоговой дисциплины. Получение подобной информации от налоговых органов может подтолкнуть их к проведению аналогичной проверки на своей территории.

Источником наводящей информации могут выступать также специализированные издания, телефонные книги, рекламные объявления. Например, налоговые управления Канады сумели выявить значительное число фирм, которые не были зарегистрированы в качестве налогоплательщиков, просматривая рекламные объявления в газетах и проверяя, есть ли такие субъекты среди зарегистрированных налогоплательщиков. Эффективным методом выявления недобросовестных налогоплательщиков является отслеживание публикаций, в которых налогоплательщикам даются советы о возможных путях уклонения от своих налоговых обязательств. Такая информация позволяет выявить приемы ухода от налогов, которым уделяется пристальное внимание при проведении проверок.

Довольно часто используемым способом отбора налогоплательщиков для проведения проверок является отбор по результатам сравнения отдельных показателей указанных в декларациях со средним значением этих показателей, рассчитанных по всем декларациям налогоплательщиков данной категории, например, по всем предприятиям отрасли. Те налоговые декларации, в которых значения этих показателей достаточно сильно отклоняются от среднего значения в ту или иную сторону выбираются для проверки. Например, в случае НДС весьма эффективным методом обнаружения фактов занижения доходов от продаж или завышения производственных расходов является выбор предприятий данной отрасли с подозрительно низкой нормой прибыли. Можно также рассчитать отношение расходов по конкретной статье (командировочных расходов) к объему реализации. Если это отношение получилось низким по сравнению с некоторым эталонным значением, например, по сравнению с предыдущими значениями этого показателя у того же налогоплательщика или по сравнению с текущими значениями этого показателя у других налогоплательщиков, то, вероятно, что данный налогоплательщик либо занизил объем реализации, либо завысил командировочные расходы.

Эффективным средством обнаружения случаев потенциального ухода от налогов является сопоставление данных, которые налогоплательщик указал в своей налоговой декларации с информацией, полученной из других источников (например, процентный доход указанный предприятием в своих расходах с процентами, которые ему выплатил банк и указал это в банковской выписке; зарплата заявленная налогоплательщиком с данными о зарплате выплаченной ему работодателем). К хорошему результату приводит сравнительный анализ данных из налоговой декларации с данными из других отчетов, представленных тем же налогоплательщиком (например, сравнение данных указанных предприятием в его налоговой декларации по НДС с информацией указанной тем же предприятием в декларации или отчете о финансовых результатах).

Одна из стратегий к которой прибегает Налоговое управление Канады для выявления незарегистрированных или не подавших декларации налогоплательщиков включает сверку своей информации с информацией о выдаче разрешений на строительство; данных о сделках с недвижимостью или о выданных лицензиях на ведение коммерческой деятельности, а также сведения по регистрации автомобилей [10]. Такая стратегия особенно продуктивна для выявления фирм, занимающихся строительством жилых домов, капитальным ремонтом зданий, коммерческим строительством или ремонтом автомобилей.

Аналогичные стратегии применяются налоговыми управлениями штатов в Америке. Например, налоговые органы штата Нью-Йорк проводят комплексную сверку данных по платежам, полученным от страхователей компаниями медицинского страхования; автоматическому удержанию налогов с зарплаты служащих работодателями- нерезидентами с данными по зарегистрированными корпорациями именами (названиями) соучредителей; налоговым декларациям товариществ и выданных городами разрешений и лицензий на различные виды деятельности с целью определения потенциальных предприятий не зарегистрировавшихся в качестве налогоплательщиков [И].

В случае с НДС часто используется сверка деклараций покупателей и продавцов сырья и материалов. Несмотря на то, что подобная форма перекрестных проверок не гарантирует высокой степени надежности (например, продавец и покупатель могут вступить в сговор и уйти от уплаты налогов вместе), она часто дает неплохие результаты. В ходе такой налоговой проверки предприятий аудитор снимает копии с некоторого ограниченного числа счетов-фактур, а затем посещает те предприятия, которым эти счета были выставлены. Затем аудитор проверяет правильность отражения предприятием сумм, израсходованных на покупку или сумм, полученных в результате реализации продукции (товаров, работ, услуг).

В последние годы налоговые службы развитых стран стали использовать для отбора налогоплательщиков методы интеллектуального анализа данных [13]. Основное назначение этих методов заключается в автоматизированном поиске ранее неизвестных закономерностей в базах данных, хранящих информацию о деятельности юридических лиц и использование полученной информации для принятия решений. К таким методам относятся экспертные системы, нейронные сети или отбор налогоплательщиков по результатам статистического анализа.

Экспертная система - это автоматизированная процедура, используемая для отбора налоговых деклараций в соответствии с некоторым набором правил. В качестве «правил» могут выступать значения конкретных полей в налоговой декларации в точности повторяющих те, которые используют в своей работе самые опытные и продуктивные работники налоговых органов. В частности, экспертные системы используются в Налоговом управлении Канады для отбора деклараций по налогу на прибыль предприятий и НДС [15].

Для разработки экспертных правил отбора в Канаде создаются группы из 30 самых квалифицированных специалистов, которые сообщают коллегам по искусственному интеллекту признаки, свидетельствующие о том, почему те или иные декларации показались им подозрительными, на что следует обратить внимание при проверке и какие суммы дополнительных начислений следует ожидать. Подозрительные признаки вводятся в систему компьютеризированного отбора налогоплательщиков при Налоговом управлении. В качестве основных источников данных используются сведения по налоговым декларациям и о проведенных проверках, а также структуре получаемых доходов налогоплательщика на территории его проживания. Таким образом, появляется возможность в автоматизированном режиме просматривать налоговые декларации и выставлять им «оценки»: стоит их проверять или не нет, а если стоит, то какие доначисления следует ожидать [12].

Анализ одного из отчетов Налогового управления Канады помог выяснить, каким образом работает такая экспертная система [16]. По отрасли «Сдача в аренду зданий и помещений» была выявлена налоговая декларация в которой заявлены значительные убытки, понесенные из-за низкого валового дохода. Специалисты выстроили компьютеризированную процедуру, позволяющую определить справедливую рыночную рентную цену любой сдаваемой в аренду недвижимости, исходя либо из заявленных в декларации расходов на выплату процентов (если недвижимость куплена в долг), либо расходов на уплату налога на имущество (если недвижимость уже принадлежит владельцу). В случае, если доход от сдачи недвижимости в аренду существенно ниже ее рыночной рентной оценки, полученной вышеуказанным способом, то такая декларация фиксируется на предмет возможного занижения рентного дохода. Затем оценивается возможная сумма дополнительных начислений в соответствии с правилами оценки и уровнем доверия, которыми пользуются наиболее квалифицированные специалисты.

Другая категория моделей искусственного интеллекта, которая также иногда используется для отбора налогоплательщиков - это нейронные сети. Настроенная нейронная сеть обеспечивает на выходе вполне определенную реакцию на данные, поступающие на вход и обладающие такими же характеристиками, что и обучающая выборка и иную реакцию на данные, обладающие другими свойствами. Искусственный нейрон имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, затем все произведения суммируются и определяется уровень активизации нейрона. Для отбора налогоплательщиков при проведении налоговых проверок на вход обученной нейронной сети подается последовательность векторов, компонентами которых являются параметры налогоплательщиков. Нейронная сеть отбирает тех налогоплательщиков, которые обладают такими же характеристиками, что и обучающая выборка.

Таким образом, можно построить алгоритм, который будет разбивать налоговые декларации на два класса: класс по которому налоговая проверка может дать большие дополнительные начисления и класс по которому вероятность больших доначислений достаточно мала. Для того чтобы «научить» нейронную сеть отличать декларации одного типа от другого используется файл данных в котором содержатся информация по результатам предыдущих проверок и данные из налоговых деклараций проверенных налогоплательщиков. Когда нейронная сеть «научится» классифицировать налоговые декларации, результаты проверки которых уже известны, ее можно использовать для классификации налоговых деклараций, по которым такие проверки еще не проводились.

Налоговые декларации, отобранные нейронной сетью как потенциально продуктивные, обычно рассматриваются экспертом, который принимает окончательное решение о том, стоит их проверять или нет, а если стоит, то на какие вопросы следует в первую очередь обратить внимание. Данный подход может использоваться как метод выявления связей между значениями, указанными в конкретных полях налоговых деклараций и вероятным уходом от налогов, то есть они могут использоваться в качестве предварительной процедуры отбора, результаты которой могут в свою очередь применяться в других процедурах отбора, например, в статистических моделях.

Налоговые органы зарубежных стран обрабатывают налоговые декларации с помощью статистических методов, например, регрессионного или дискриминантного анализа и по его результатам строят модели, позволяющие определить, принесет проверка данного налогоплательщика большие дополнительные начисления или нет. Документальной проверке налогоплательщиков отобранных по этим признакам уделяется в будущем первостепенное значение. В том или ином виде этот подход используется во многих странах с развитой рыночной экономикой.

В частности, в Федеральном налоговом управлении США строят специальный массив данных по результатам особо тщательных проверок случайных стратифицированных выборок физических лиц и предприятий малого и среднего размера, проводимых в рамках программы «Измерение законопослушности налогоплательщиков» [8]. Отобранные случайным образом налоговые декларации стратифицируются по основному источнику дохода, размеру дохода или размеру фирмы. Затем строится статистическая модель, которая предсказывает вероятность того, что документальная проверка заявителя налоговой декларации приведет к доначислениям. Модель представляет собой функцию от показателей, которые налогоплательщик указывает в своей налоговой декларации. Обычно она строится так: выбирается группа (страта) налоговых деклараций по которым уже известны результаты доначислений. Такие налоговые декларации разбиваются на два класса: «стоило проверять» (1)и «не стоило проверять» (0). Принадлежность декларации к одной из этих двух категорий является моделируемой переменной. При этом задача математического моделирования заключается в определении того какую оценку получает данная декларация - 0 или 1 в зависимости от указанных в ней данных.

Построение модели начинается с того, что в ее правую часть в качестве объясняющих переменных включается большое число переменных, а затем начинают постепенно исключать те переменные, чей вклад в объяснение зависимой переменной («проверять» или «не проверять») невелик. При этом в модель подставляют не сами значения указанные в налоговой декларации, а их бинарные аналоги, которые принимают значение 1, если указанное в декларации значение попадает в некоторый интервал и 0, если оно лежит вне этого интервала. В модели используются не абсолютные значения указанных в декларации переменных, а более сложные их аналоги, например, отношения между значениями, стоящими в разных полях декларации.

Таким образом, сначала составляется большой список переменных на включение их в модель, а затем с помощью статистического анализа этот список сокращается до небольшого их числа (порядка 10), вклад которых в объяснение моделируемой переменной наиболее значителен. После этого окончательная версия модели применяется ко всем налоговым декларациям данного класса и отобранные декларации передаются высококвалифицированному налоговому специалисту (классификатору). Классификатор просматривает все декларации и по каждой из них дает свое заключение - следует или не следует проводить налоговую проверку налогоплательщика и если следует, то на каких именно аспектах должна быть сосредоточена проверка. Необходимо отметить, что почти половина всех выездных налоговых проверок по налогам на доходы физических лиц и корпораций проводится в США по налогоплательщикам, отобранным именно в соответствии с этими моделями [17].

Таким образом, чтобы поставить процесс выбора предприятий на прочную статистическую основу необходимо иметь три основные составные части: подходящую базу данных, специалистов, имеющих богатый практический опыт проведения налоговых проверок (аудита) и собственно статистические модели.

Ключевым вопросом для создания прочного статистического фундамента для выбора плательщиков является наличие хорошей статистической модели [7]. Статистическая модель служит своеобразным «окном» через которое можно рассматривать имеющиеся данные о каждом предприятии и решать вопрос о том является это предприятие перспективным на проведение аудита или нет. Для выбора налогоплательщиков можно использовать разные типы моделей, но все эти модели объединяет то, что они предполагают проведение детального анализа данных по предприятиям уже подвергшимся налоговой проверке. В процессе такого анализа выявляются связи между различными характеристиками налогоплательщика и доначислениями.

Большинство моделей статистического выбора налогоплательщиков распадается на два типа: модели двоичного отклика (бинарные модели) и регрессионные модели. Хотя налоговые ведомства разных стран обычно предпочитают пользоваться каким-то одним типом моделей более предпочтительным вариантом является совместное использование моделей и того и другого типа. Модели двоичного отклика показывают, насколько высока вероятность того, что проверка данного предприятия приведет к дополнительным налоговым начислениям, а регрессионные модели позволяют выявить вероятный размер доначислений в случае, если проверка окажется результативной. Для принятия обоснованного решения о том, следует или не следует проводить документальную проверку по данной налоговой декларации желательно иметь оба типа информации.

Модели бинарного отклика тоже бывают разными. Наибольшую известность получили дискриминантные модели «probit» и «logit» [3]. Эти модели применяются тогда, когда анализируются количественные данные, отражающие выбор между двумя альтернативами - «да» или «нет». Моделируемая переменная при этом всегда является бинарной, а ее прогнозное значение показывает вероятность того, что она примет единичное значение. Модели различаются тем, какую функцию распределения зависимой переменной они используют («logit» - логистическую, «probit» - нормальную).

Общим у всех этих моделей является то, что они позволяют оценить вероятность того, что налогоплательщик с данными характеристиками окажется «продуктивным», если будет подвергнут документальной проверке. В частности, в модели «logit» вероятность осуществления дополнительных налоговых начислений по результатам проверки данного плательщика описывается логистической функцией.

В качестве объясняющих переменных могут выступать фиктивные переменные, принимающие значение 1, если у данного плательщика присутствует некоторый атрибут (например, в поступившей от него налоговой декларации была задекларирована некоторая ненулевая сумма причитающихся с него налогов), и 0 в противном случае. С другой стороны, в качестве объясняющих могут также использоваться переменные, отражающие денежную сумму, указанную в той или иной строке отчета или отношение величин, указанных в разных графах. Если объясняющая переменная умножается на положительный коэффициент, то чем больше значение этой переменной, тем больше вероятность того, что проверка предприятия к которому она относится, приведет к дополнительному начислению налогов. Отрицательный знак коэффициента на который умножается объясняющая переменная имеет противоположный смысл. Значения коэффициентов заранее не известны, они получаются в результате статистической оценки модели заданной спецификации по данным о предприятиях, о которых имеются как стандартные данные, так и результаты ранее проведенных проверок. Чтобы построить оценки коэффициентов такой модели, необходимо иметь значения моделируемой бинарной переменной, отражающей начисление дополнительных налогов в результате проверки, а также значения объясняющих переменных, включенных в модель.

Модель можно записать в виде математической формулы, которая показывает, насколько высока вероятность того, что налоговая проверка данной налоговой декларации приведет к дополнительным налоговым начислениям. Пропустив через такую модель все поданные декларации можно составить список плательщиков, которые могут считаться потенциальными кандидатами на проведение налоговой проверки. Как показывает практика применение любых моделей бинарного отклика или дискриминантного анализа дает весьма схожие результаты [1].

Недостатком моделей двоичного отклика является то, что они моделируют вероятность положительного исхода документальной проверки. По результатам такой проверки будут сделаны дополнительные начисления, но они не предсказывают величину этих начислений. Таким образом, они позволяют более или менее точно идентифицировать плательщиков, пытающихся уйти от налогов, но не позволяют различать случаи мелкого и крупного ухода от налогов, а ведь именно эти случаи обычно интересуют налоговые органы.

Регрессионные методы и модели обычно используются для того, чтобы объяснить от каких факторов зависит величина дополнительных налоговых начислений у плательщиков, которым такие начисления были сделаны. В качестве зависимой переменной обычно выступает переменная, отражающая результативность документальной проверки, а в качестве объясняющих переменных, как и в моделях бинарного отклика, различные характеристики налогоплательщика. При оценке неизвестных коэффициентов модели, построенное регрессионное уравнение можно применить ко всей совокупности налоговых деклараций и по каждой из них в случае проведения документальной проверки предсказать размер дополнительных налоговых начислений.

Недостатком регрессионных методов, в случае, если они не подкрепляются моделью бинарного отклика, является недоучет вероятности того, что некоторые документальные проверки могут не приводить к дополнительным начислениям. Таким образом, они позволяют предсказать величину дополнительных начислений в случае продуктивной проверки, но не содержат никакой информации о том, насколько высока вероятность того, что дополнительные начисления будут произведены и проверка окажется продуктивной [4].

Комбинированный подход отбора налогоплательщиков путем использования статистических моделей является наиболее целесообразным [3]. Модель бинарного отклика дает оценку вероятности того, что проверка налогоплательщика окажется продуктивной, а регрессионная модель покажет, насколько большим может быть доначисление в случае, если проверка окажется продуктивной. Таким образом, перемножив эти два числа, получают оценку продуктивности проверки или оценку ожидаемого размера начислений. Такая информация была бы полезна не только для принятия обоснованного решения о том, каких налогоплательщиков следует проверять, но и для целей прогнозирования налоговых поступлений. Зная, сколько средств выделено на проведение проверок, можно заблаговременно определить, сколько доходов может быть дополнительно начислено по результатам документальных проверок до того, как будут проведены сами проверки.

Для построения и успешного применения статистических моделей, когда одновременно используются модели двоичного отклика и регрессионная модель требуется выполнить пять этапов.

На первом этапе для каждой из моделей необходимо составить список переменных, которые потенциально можно отнести к объясняющим. В случае если имеется модель бинарного отклика, эти переменные будут сигнализировать о правдоподобии того, что имеется уход от налогов (налоговая база задекларирована не полностью). В случае регрессионной модели объясняющие переменные будут предсказывать, на какую сумму занижены причитающиеся налоги, если они занижены. Выбор объясняющих переменных может опираться на прошлый опыт, интуицию или проводиться методом проб и ошибок.

Поскольку большинство переменных, которые сигнализируют о наличии или отсутствии ухода от налогов, скорее всего, будет также связано с размером этого ухода, то есть с тем, насколько велика или мала сумма занижения, в списки потенциальных объясняющих переменных по бинарной и регрессионной моделям рекомендуется включать одни и те же переменные.

На втором этапе с помощью специальной методологии из составленных на первом шаге списков переменных для каждой модели выбираются те, которые хорошо «работают» и имеют лучшие прогнозные свойства. В настоящее время нет единого мнения о том, какой именно метод построения спецификации модели является наилучшим. Таких методов существует довольно много, но основных всего три: метод включений, метод исключений и пошаговый метод.

Метод включений (метод «прямого отбора») заключается в том, что сначала строится модель в которой моделируемая переменная зависит от одной объясняющей переменной. В такую модель последовательно подставляются все объясняющие переменные из списка. Та переменная t-статистика которой окажется самой высокой считается выбранной для включения в модель на постоянной основе. Затем точно так же последовательно перебираются всевозможные спецификации, где моделируемая переменная зависит от двух объясняющих переменных: одна, которая уже выбрана на первом шаге и другая, которая дает наибольшую t-статистику. После этого перебираются всевозможные трехфакторные спецификации, когда две переменные уже известны, а третья нет. Процесс продолжается до тех пор, пока ни одна из остающихся не включенных в модель объясняющих переменных не сможет дать t-статистику, превышающую некоторый выбранный уровень значимости.

Метод исключений (метод обратного выбора) начинается с того, что оценивается модель, в которую включены всевозможные объясняющие переменные. Затем из нее по одной удаляются переменные, дающие наименьшую t-статистику. Так продолжается до тех пор, пока в модели не останутся только такие объясняющие переменные t-статистика которых превышает некоторый выбранный порог значимости.

Метод пошагового отбора начинается так же, как и метод последовательных включений. В отличие от этого метода, включенная на определенном шаге переменная, может на некотором последующем шаге быть исключена из модели. При включении в модель каждой новой переменной проводится проверка того не снизилась ли t- статистика каких-либо из ранее включенных в модель переменных ниже допустимого уровня значимости. Если это произошло, переменные с низкими t-статистиками исключаются из модели и процедура повторяется на новом шаге. Процесс выбора завершается тогда, когда среди включенных в модель переменных не окажется таких, у которых t- статистики ниже установленного порога значимости. При этом ни одна из не включенных в модель переменных не имеет t-статистику, превышающую требуемый для включения в модель порог значимости.

На третьем этапе специфицированные и оцененные модели применяются ко всем поданным налоговым декларациям для расчета ожидаемой продуктивности проверки соответствующих плательщиков. Декларации, получившие самые высокие оценки продуктивности, отмечаются как кандидаты на проведение документальной проверки.

На четвертом этапе подготовленный список условно выбранных плательщиков передается специалисту налогового органа (эксперту- классификатору), который рассматривает выбранные декларации и решает, заслуживают они того, чтобы по ним была проведена налоговая проверка или нет.

На пятом этапе осуществляется проверка выбранных налогоплательщиков, а ее результаты заносятся в базу данных. Такая расширенная база данных используется для обновления модели выбора налогоплательщиков в следующем году.

Рассмотрим, каким образом строится и используется статистическая модель выбора налогоплательщиков на примере предприятий Республики Татарстан, выпускающих промышленную продукцию. Для этого была скомбинирована система искусственно сгенерированных данных об уклонении от уплаты налога на прибыль со стандартными отчетными данными. Выдвинута гипотеза о том, что отчетные показатели представляют собой выборочную совокупность из базы данных территориального налогового органа.

При выборе налогоплательщиков использовались две модели: модель бинарного отклика и регрессионная модель. Бинарная модель показывает вероятность того, что проверка налогоплательщика приведет к дополнительным налоговым начислениям, а регрессионная модель -ожидаемую величину этих начислений. В нашем случае для бинарной модели было решено использовать спецификацию «logit». Оценка моделей такой спецификации проводилась методом максимального правдоподобия. Форма регрессионной модели выбрана логлинейной. Предполагается, что натуральный логарифм дополнительных налоговых начислений есть линейная функция от объясняющих переменных, а случайное возмущение регрессионной модели распределено нормально со средней равной нулю и постоянной дисперсией. Такая спецификация подразумевает, что величина дополнительных начислений при данных значениях объясняющих переменных распределена логнормально. Подобная спецификация является подходящей потому, что на практике распределение дополнительных налоговых начислений обычно отличается высокой скошенностью, то есть небольшие дополнительные начисления получают многие налогоплательщики из числа проверенных. При этом небольшое число налогоплательщиков получает чрезвычайно высокие дополнительные начисления.

На первом шаге были построены идентичные списки объясняющих переменных для включения в обе модели:

X) - количество лет, в течение которых данное предприятие является налогоплательщиком в налоговом органе;

Х2 - фиктивная переменная равная 1, если указанная в декларации валовая прибыль предприятия равна нулю и 0 в противном случае;

Х3 - фиктивная переменная равная 1, если в отчетности указана отрицательная валовая прибыль и 0 в противном случае;

Х4 - фиктивная переменная равная 1, если указанная в отчетности величина выручки от реализации равна 1 и 0 в противном случае;

Xs — фиктивная переменная равная 1, если указанная в отчетности величина внереализационных доходов равна 1 и 0 в противном случае.

Переменная X! включена в список для того, чтобы учесть возможность существования у вновь созданных и новых предприятий разных моделей поведения как налогоплательщиков. Переменные Х2 - Х5 включены в модель потому, что при анализе данных выявляются факты наличия у предприятий нулевой (42%) или отрицательной (13%) валовой прибыли, а также отсутствия наличия выручки от реализации (8%) и внереализационных доходов (26%). Предлагая включить эти переменные в модель, мы попытались учесть возможность того, что поведение таких предприятий налогоплательщиков отличается от поведения предприятий, указывающих в своей отчетности ненулевые суммы доходов.

Остальные восемь переменных в списке отражают результаты сравнения отчетности предприятий внутри групп предприятий, имеющих одинаковые коды отраслевой принадлежности по основному виду деятельности (ОКВЭД). Все эти переменные являются фиктивными (бинарными), которые принимают значение 1, если сведения, указанные предприятием в своей отчетности сильно отличаются от сведений, поданных остальными предприятиями той же категории. К таким переменным были отнесены следующие:

Х6- фиктивная переменная равная 1, если отношение выручки от реализации к себестоимости реализованной продукции находится в пределах первого квартиля (ниже 25-го процентиля) и 0 в противном случае;

Xj - фиктивная переменная равная 1, если отношение доходов к расходам по внереализационным операциям ниже 65-го процентиля и О в противном случае;

Xg - фиктивная переменная равная 1, если отношение вычетов из валовой прибыли к сумме валовой прибыли превышает 90-й процен- тиль и 0 в противном случае;

Х9 - фиктивная переменная равная 1, если отношение величины налогооблагаемой прибыли к валовой прибыли ниже медианного значения и 0 в противном случае;

Хю- фиктивная переменная равная 1, если отношение дохода от реализации к активам ниже 20-го процентиля и 0 в противном случае;

Х| 1 — фиктивная переменная равная 1, если отношение валовой прибыли к доходам от реализации ниже 20-го процентиля по промышленной группе, и 0 в противном случае;

Х)2 — фиктивная переменная равная 1, если отношение валовой прибыли к текущим активам и основным фондам ниже медианного по промышленной группе и 0 в противном случае;

Х)3_ фиктивная переменная равная 1, если отношение нематериальных активов к совокупным активам превышает 90-й процентиль и О в противном случае.

Каждая их этих фиктивных переменных автоматически приравнивается к нулю, если в числителе отношения стоит нуль. Процен- тильные сечения были выбраны таким образом, чтобы единичные значения фиктивных переменных присваивались небольшому числу предприятий. Отношения, с помощью которых создавались эти фиктивные переменные, выбирались таким образом, чтобы отразить различные аспекты деятельности предприятия, отраженной в его отчетности. В случае, если какие-то характеристики этой деятельности, которые мы попытались уловить с помощью указанных отношений, выходили за пределы нормы для данной категории предприятий, соответствующей фиктивной переменной присваивалось значение 1.

Поскольку мы не располагали данными о том, какие начисления были в действительности проведены по результатам налоговых проверок, в целях иллюстрации было решено построить такие данные искусственным образом. Чтобы их сгенерировать, нам необходимо было задать значения коэффициентов модели «logit» и регрессионной модели. Были выбраны такие значения, которые более или менее согласуются с реально наблюдаемыми. Чтобы придать спецификации модели более осмысленный характер для генерирования результатов использовались неполные спецификации обеих моделей. Для модели «logit» в спецификацию были включены 7 переменных (Х2, Х3, Х4, Х7, Xg, Хю), а для регрессионной модели (Xj, Х2, Х3 Х4, Хб, Хд, Хн).

Дисперсия случайного возмущения в регрессионной модели выбрана достаточно большой, чтобы отразить ту объективно существующую закономерность, что значительную долю вариации доначислений никогда не удается объяснить на основе имеющихся данных. Затем с помощью генератора случайных чисел был построен ряд искусственных сумм, якобы дополнительно начисленных по результатам проверки так, чтобы они согласовались как с предположениями обеих моделей, так и конкретными значениями коэффициентов этих моделей, которые были выбраны. В результате средняя величина дополнительных начислений на одну налоговую проверку составила 10,3 д.е., тогда как средняя величина самоначислений (начислений, которые предприятия указали в своих расчетах) - 60 д.е. При этом положительная величина дополнительных начислений присвоена только 42% предприятий. Таким образом, 58% общего числа предприятий оказалось законопослушными налогоплательщиками. Для предприятий нарушителей средний размер дополнительных начислений составил 25,1 д.е., медианное значение начислений по этим предприятиям составило 760 д.е., что существенно ниже среднего значения. Это свидетельствует о большой несимметричности распределения дополнительных начислений.

В каждую из двух моделей был также включен свободный член. Коэффициент детерминации регрессионной модели, которая была использована в имитационных прогонах, составил 15%. Таким образом, оказалось, что модель способна объяснить только 15% совокупной вариации дополнительных начислений. Если бы мы указали меньшую дисперсию для случайного возмущения в уравнении регрессии, то коэффициент детерминации получился бы более высоким.

Чтобы проиллюстрировать эффективность методологии выбора предприятий данные по уходу от налогов (как нулевые, так и ненулевые в пропорции 52:48) сгенерированы для всех предприятий, попавших в выборку. Чтобы сделать задачу более реалистичной мы предположили, что результаты начислений известны по проведенным проверкам только для некоторого числа предприятий выбранных в случайном порядке. Таким образом, модель выбора строилась только по данным о предприятиях на которых ранее якобы были проведены проверки.

Для построения спецификации модели «logit» и регрессионной модели использовались все три процедуры выбора объясняющих переменных: прямой, обратный и пошаговый отбор. Таким образом, было получено по три варианта спецификаций каждой модели. Процедуры по выбору спецификаций для модели «logit» применялись ко всей подвыборке. Интересно отметить, что все три процедуры дали одинаковый результат, то есть были выбраны одни и те же объясняющие переменные (Х2, Х3, Х4, Xj, Xg, Х9) Это те переменные, которые были включены в истинную спецификацию, по которой генерировались данные. Единственное исключение касается переменной Хю, которая входила в истинную спецификацию, но не вошла в статистически выбранную, однако вместо нее вошла другая переменная (Х9). Не существует никаких гарантий, что та или иная процедура позволит всегда и при любых обстоятельствах определять истинную спецификацию модели. Можно предположить, что выбранная спецификация окажется достаточно работоспособной, когда дело коснется ее практического применения.

Процедуры выбора объясняющих переменных применялись только для тех предприятий, предыдущая проверка которых дала положительный результат. Применение всех трех процедур дало одинаковый набор переменных (X,, Х3, Х4, Х6, Х13) В спецификацию не были выбраны только две переменные (Х2 и Х9) Вероятно, что они оказались незначимыми для предсказания дополнительных начислений.

Оцененные «logit» модель и регрессионную модель с выбранными объясняющими переменными мы использовали впоследствии для того, чтобы для каждого из предприятий, оставшихся непроверенными, предсказать размер потенциального доначисления. Эти прогнозные значения определены как произведение вероятности ненулевого начисления в случае проверки на ожидаемую величину доначисления при условии, что доначисление будет положительным. Значение вероятности было определено из «logit» модели, а ожидаемая величина доначислений из регрессионной модели.

Поскольку данные по уходу от налогов были сгенерированы для всех предприятий, появилась возможность оценить, насколько эффективно работает выбранная статистическая модель. Для этого проведено сравнение полученного с ее помощью результата с максимально возможными доначислениями (если бы проверка была сплошной) и при проверке предприятий, отбираемых в случайном порядке. В результате получили средний размер доначислений в размере 9850 д.е. для случая, если бы предприятия для проверки отбирались в случайном порядке.

При использовании статистической процедуры отбора все предприятия проранжированы в порядке возрастания. Таким образом, удельный размер доначислений в расчете на одну проверку снижался по мере увеличения числа проверок. Следовательно, направленный статистический отбор предприятий существенно превысил по своей продуктивности случайный отбор. Это особенно заметно, если на проведение проверок выделяется мало денежных средств и проверке подвергается небольшое е число предприятий.

С другой стороны, продуктивность процедур направленного статистического выбора оказалась существенно более низкой, чем максимально возможный результат. Например, если бы мы заранее знали, какие предприятия из имеющейся выборке скрыли максимальный объем прибыли и не уплатили налог и подвергли проверке только их, то средний размер доначислений в расчете на одну проверку составил бы 345826 д.е., что примерно в 4 раза выше средней продуктивности проверок первых проверенных предприятий. Причина такого большого расхождения заключается в том, что мы специально выбирали параметры истинных статистических моделей таким образом, чтобы за счет наблюдаемых характеристик предприятий можно было бы объяснить лишь небольшую часть вариации моделируемой переменной (порядка 10%).

На практике приходится иметь дело с огромной вариацией законопослушности налогоплательщиков с аналогичными и весьма похожими наблюдаемыми характеристиками, так что рассчитывать на то, что когда-нибудь удастся с высокой вероятностью выявить самых злостных неплательщиков, не приходится. Наша задача заключалась в том, чтобы продемонстрировать применение статистических методов, позволяющих весьма эффективно выделить небольшую часть вариации доначислений, которые можно объяснить с помощью наблюдаемых характеристик налогоплательщиков. Даже если эта часть достаточно мала, потенциальный выигрыш от использования этой информации может быть большим.

Результаты расчетов по таким статистическим моделям можно использовать для прогнозирования доначислений при разной степени охвата плательщиков налоговыми проверками, то есть еще до того, как эти проверки будут фактически проведены. Это может пригодиться для планирования выездных налоговых проверок.

По результатам наших расчетов в большинстве случаев прогнозные значения оказались в пределах от + 10% до - 10% от фактических. Точность прогнозов зависит от устойчивости случайного возмущения регрессии (необъясненной доли вариации), а также от размеров выборки, по которой оценивалась модель. Меру точности прогнозных значений доначислений получить в любом случае достаточно легко и можно всегда создать доверительный интервал необходимого размера, в котором будет лежать истинное значение доначислений.

Полученные результаты рассчитывались нами исходя из предположения о том, что всем анализируемым декларациям был присвоен наивысший ранг, при котором они подвергаются документальной проверке. Результаты анализа были переданы эксперту, который еще раз проанализировал отобранные декларации. Участие эксперта- классификатора позволяет, как правило, повысить эффективность всего процесса, поскольку он еще больше сужает выбор, отсекая случаи, которые с его точки зрения не заслуживают внимания. Он может оказать значительную помощь при проведении налоговой проверки, зная о причинах, связанных с большим объемом дополнительных начислений.

Список литературы

  • 1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 2015.
  • 2. Верин В.П. Преступления в сфере экономики. М.: Дело, 2016.
  • 3. Доугерти К. Введение в эконометрику: Учебник. - 2-изд. / Пер. с англ. М.: ИНФРА-М, 2014.
  • 4. Дутова К.А. Статистические методы прогнозирования в экономике. М.: ИНФО, 2015.
  • 5. Коломина Л.Д. Экономическая преступность и правотворческая практика // Законность. №7, 2016.
  • 6. Aim J., Erard В., Feinstein J.S. The Relationship Between State and Federal Tax Audits // Empirical Foundations of Household Taxation / Ed. M. Feldstein and J.V.Poterba. - Chicago: University of Chicago Press, 2016.
  • 7. Allingham M.G., Sandmo A. Income tax evasion: a theoretical analysis //Journal of Public Economics. - Vol. 1, November, 2015.
  • 8. Asner L.S. Neural networks and Discriminant Function: Alternative Techniques of Selecting returns for Audit // The IRS Research Bulletin, Publication 1500, Internal Revenue Service /- Washington: D.C., 2016.
  • 9. Auditor General of Canada. Revenue Canada: The new Regime for Processing Income Tax Returns // Report of the Auditor General of Canada to the House of Commons, Chapter 25, November, Ottava: Minister of Supply and Services Canada, 2015.
  • 10. Cowell F.A. The economic analysis of tax evasion 11 Bulletin of Economic Research. - Vol. 37. - №3, 2016.
  • 11. De Jantscher, Silvani C., Holland G. The Audit of VAT // Value-Added Tax: Administrative and Pollicy Issues / Ed. A.A. Tait. International Monetary Faund Occasional Paper no. 88, October. - Washington: D.C., 2016.
  • 12. Due J.F. and Mikesell J.L. Salew Taxation: State and Local Structure and Administration, 2 nd ed. - Washington: D.C.: The Urban Institute Press, 2016.
  • 13. Herburn G. The estimates of cash-based income tax evasion in Australia. - Australian Economic Review. - 2 nd quarter, 2014.
  • 14. International Journal of Urban and Regional Research. - 2016.- Vol. 23,-№4.
  • 15. Murray M.N. Sales Tax Compliance and Audit Selection // National Tax Journal (48:4), 2015.
  • 16. Revenue Canada. Compliance: From Vision to Strategy: Document no. 97-056. Ottava: Revenue Canada, 2016.
  • 17. Thomson R. Risk Assessment at Revenue Canada: notes on Computer Assisted Audit Selection (CAAS), Mimeograph, March 5. - Ottava: Revenue Canada, 2016.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >