Статьи по экономическим темам

Ганах Н. І.

Академія державної податкової служби України

В автоматизованій інформаційній системі органів ДПА нагромаджуються і зберігаються в процесі діяльності всіх її підрозділів великі обсяги довідникових та оперативних фінансових даних. Ці гіпервелики БД (загальнодержавні реєстри, довідники, операційні дані) вміщують у собі великі потенційні можливості для набуття нової, експертної та анлітичної інформації, на основі якої можна і необхідно визначати стратегію розвитку і вдосконалення податкової системи, виявляти тенденції справляння податків, приймати рішення і проводити експертизу податкових надходжень. Для окремих підрозділів ДПА (аналізу та аудиту) такі експертні функції є невід'ємною частиною їх повсякденної діяльності, але для більшості інших підрозділів, які займаються окремими видами податків, бюджетних надходжень, місцевими податками і зборами, розслідування податкових порушень тільки починають розуміти і виконувати цю титанічну інформатизацію експертних та аналітичних робіт.

Спроби побудувати експертні системи і технології підтримки прийняття рішень у податкових службах на базі інструментів, які безпосередньо звертаються до БД оперативної обробки транзакцій (OLTP-системи), закінчуються в більшості випадків невдачами. По-перше, аналітичні запити й експертні технології "конкурують" з транзакціями, блокуючи дані і викликаючи нестачу обчислювальних ресурсів. Особливість реляційних СУБД, які використовуються в податкових органах, полягає в тому, що більшість операційних інструментів БД базується на реляційних операціях з'єднання різного типу. В результаті обсяги проміжних БД зростають на кілька порядків, що і призводить до надмірного перевантаження цільових СУБД. По-друге, архітектура операційних БД і систем маніпулювання податковими даними орієнтовані на виконання великої кількості коротких і частих запитів та внаслідок цього дуже неефективні в задачах експертної оцінки й аналізу в діяльності податкових служб. По-третє, в органах ДПА одночасно існує і використовується велика кількість оперативних систем у різних підрозділах і на різних рівнях податкових служб (райони, області, головні управління). Характерним для цих податкових БД є застосування різних структур даних, одиниць виміру (млн., тис., од., грн., дол. та ін.), способів кодування та ін. Таким чином, для остаточного використання в окремих підрозділах у процесах аналізу та експертизи податкових даних реалізація зведених запитів (одночасно до кількох БД, або кількох варіантів однієї БД у різних підрозділах) перетворюється в завдання, яке практично не можна розв'язати.

Найефективніших засіб для забезпечення можливостей підтримки експертних систем в податкових службах - створення сховищ даних, які є інтегрованими гіпервеликими СУБД для одночасної підтримки різних систем оперативного доступу до даних податкової інформації. Сховища даних фактично забезпечують можливості реалізації складних експертних функцій у середовищі надпотужних реляційних СУБД завдяки спеціальним властивостям, основними з яких є наступні:

- процесна і предметна орієнтованість відносно основних аспектів податкової інформації (платники, податки, терміни, суми недоїмок, переплат, пені та ін.);

- системна інтеграція в умовах різнорідних БД і систем маніпулювання даними;

- визначеність у термінах і незмінність, тобто ретроспективність (у різних категоріях термінів сплати) та пов'язаність окремих операцій (надходження, відрахування, донарахування та ін.) з обмеженнями внесення змін у сховищах даних.

Основне призначення сховища даних у контексті функціонування експертних систем ПС – це безперервна підтримка, постачання й управління необхідною інформацією у процесах податкового менеджменту та адміністрування податкових надходжень. За своєю суттю цей інформаційний процес передбачає постійний розвиток, удосконалення, рішення все нових завдань і практично ніколи не закінчується, тому його не можна розмістити у більш-меньш чітких часових проміжках, так як це можна зробити для розробки традиційних систем оперативного аналізу податкової інформації.

Використання сховища даних для підтримки експертних систем має дві основні форми: корпоративні сховища даних і кіоски даних (відповідно, enterprise data warehouses i data marts). У такому контексті корпоративні сховища даних податкових служб повинні вміщувати інформацію, яка відноситься до всієї установи і зібрана із множини оперативних джерел для консолідованої експертизи та аналізу. Як правило, подібні сховища охоплюють цілу низку аспектів діяльності податкових служб і використовуються для прийняття як тактичних, так і стратегічних рішень у процесі експертизи. Корпоративне сховище експертної системи вміщує деталізовану й узагальнюючу інформацію, його обсяг може коливатись від 20-40 Гбайт до кількох терабайтів. Вартість створення і підтримки таких корпоративних сховищ даних достатньо висока і їх створенням займаються централізовані відділи інформаційних технологій. Створюються вони за технологіями “зверху-вниз”, тобто спочатку проектується загальна схема, а потім вже починається заповнення даними. Тривалість подібних процесів – кілька років, як мінімум.

OLAP-системи у вигляді кіосків даних вміщують підмножину корпоративних даних експертної підсистеми і будуються для окремих відділів і підрозділів всередині установи, яка має розгалужену структуру (що характерно для районних і областних служб ДПА). Кіоски даних найчастіше будуються силами самих відділів і охоплюють окремі аспекти, які потрібні для виконання експертних задач працівниками цих відділів. Кіоск даних може отримувати дані з корпоративного сховища (залежний кіоск), наприклад, із централізованої бази даних ДПА, або, що найбільш розповсюджене, дані можуть поступати безпосередньо із оперативних джерел (незалежний кіоск). Для останнього випадку характерна більшість оперативних транзакційних баз даних податкової звітності юридичних і фізичних осіб, декларацій, фінансової звітності та інших документів.

У більшості випадків кіоски і сховища даних будуються у межах експертних систем за подібними принципами і використовують практично однакові технології. Різниця полягає у тому, що завдяки відмінностям у розмірах систем і об’ємах інформації у процесах проектного менеджменту таких експертних систем використовуються можливості масштабування рішень і принципи гетерогенності інформаційного середовища при перенесенні подібних рішень на різноманітні інформаційні продукти і технології.

Перелік основних компонентів сховищ даних, які використовуються при побудові експертних систем, є стандартним:

1) сукупність оперативних джерел даних;

2) засоби проектування розробки;

3) інструменти перенесення і трансформації даних;

4) система управління базами даних;

5) інструменти доступу і аналізу даних;

6) технології адміністрування.

Основна особливість створення експертних систем полягає у тому, що в технологічних та інструментальних засобах сховищ даних (пп.2–5) передбачаються спеціальні інструменти для підтримки експертних процесів (БД експертних моделей і знань).

Характерно, що процеси створення, підтримки і використання сховищ даних у експертних системах традиційно пов’язані із значними витратами, що у першу чергу пов’язано з високою вартістю доступних на ринку інструментів. Ці інструменти практично не інтегруються між собою, оскільки у більшості випадків вони грунтуються не на відкритих і стандартних, а на часткових і закритих протоколах, інтерфейсах і т. п. Складність і дороговизна зробили практично неможливим побудову експертних систем на основі сховищ даних для невеликих і середніх установ, у той час, як потреби в аналізі даних має будь-яка установа (або, наприклад, підрозділ районої чи обласної ДПА) незалежно від масштабів аналітичної діяльності та експертизи податкової інформації.

З метою врахування вимог користувачів у своїх корпоративних технологіях компанія Microsoft вже осмислила важливість напрямів, пов’язаних з сховищами даних, і необхідність прийняття мір щодо створення інструментального і технологічного середовища, яке дозволяє мінімізувати витрати на підтримку експертних систем на базі сховищ і зробити цей процес доступним для пересічних користувачів корпоративних систем. Продуктом такого класу є інструментарій сховищ даних MS (MS Data Warehousing Framework, DWF (рисунок), який представляє основні специфікації для середовища створення і використання сховищ даних. Ці специфікації визначають розвиток не тільки нової лінії продуктів MS (як, наприклад, SQL Server 7.0), але і технологій, що забезпечують інтеграцію продуктів різних виробників. Відкритість середовища DWF забезпечує її підтримку для багатьох виробників програмного забезпечення, що, у свою чергу, дає можливість кінцевим користувачам вибирати найбільш прийнятні для них інструменти сховищ даних та експертних систем.

Специфікації середовища створення і використання сховищ даних для експертних систем у ПС

Рис. Специфікації середовища створення і використання сховищ даних для експертних систем у ПС

Основною метою продуктів DWF, які орієнтовані на створення експертних систем, є спрощення розробки, впровадження й адміністрування сховищ даних, що дозволяє реалізувати наступні завдання і процеси:

- забезпечення відкритої архітектури, яка достатньо раціонально інтегрується і розширюється кінцевими користувачами і незалежними розрбниками ПЗ;

- реалізація експорту та імпорту гетерогенних даних разом з їх перевіркою, очищенням і можливим введенням історії нагромадження у процесах аналізу та експертизи;

- підтримка доступу до розподілених метаданих з боку процесів розробки сховищ, витягування і трансформації даних, управління сервером і аналізу даних кінцевими користувачами, які також розосереджені у розподіленій мережі;

- наявність вбудованих служб планування задач, управління дисковою пам’яттю, моніторингу продуктивності, повідомлення і реакції на події, у тому числі в процесах захисту інформації і протидії аварійним ситуаціям.

Врахування визначених вище особливостей у процесах модернізації АІС ДПА і впровадження адекватних експертних систем відкривають широкі можливості вдосконалення податкових органів у процесах їх реформування, модернізації інформаційних служб і введення нового Податкового кодексу.

Статья посвящена проблемам создания и внедрения експертних систем в налоговых службах. Анализируються современные направления в реализации експертных систем и предлагаються концепции их создания и поддержки на основе технологий хранилищ данных и инструментальных средств оперативного анализа (OLAP).

Добавить комментарий


Защитный код
Обновить