Да хакнем Търговския регистър!

хакер

Как ще реагирате, ако някой каже, че иска да хакне Търговския регистър, който се администрира от Агенцията по вписванията и съдържа информация за всички компании и юридически лица в България, включваща адреси, собственици и управители? Тази информация е с голяма обществена значимост и подобни закани за намеса неминуемо будят притеснение. По същество хакването представлява разбиване на определена компютърна система, най-често заради някаква облага. Но точно защото облагата може да е и обществена, не винаги това действие трябва да се възприема негативно.

Именно такъв е и конкретният случай, в който българската компания за семантичен софтуер "Онтотест" ще участва с проекта "Да хакнем Търговския регистър" в първото практическо предизвикателство, свързано с обработката и анализа на данни за Централна и Източна Европа – Datathon Bulgaria. Компанията най-общо отправя предизвикателство към участниците в споменатия "маратон" да преобразуват информациите от Търговския регистър във формат отворени и свързани данни (Linked Open Data – LOD). Целта е да се демонстрира как семантичниите графови бази данни могат да разкрият връзки и скрити факти в масив с ненормализирани данни. Например да идентифицират и класифицират най-големите групи от свързани фирми в България или в определен район. Или пък да анализират как съвместното участие на директори в бордове на различни дружества се отразява на сферите им на влияние.

"Онтотест" ще предостави на участващите екипи част от базата на Търговския регистър и с нейно съдействие те ще бъдат преведени през процеса на превръщането на този масив в свързани отворени данни. Стремежът на фирмата е да покаже как един голям набор от изключително сложни данни, като тези на Търговския регистър, могат да бъдат превърнати във формат, който да е достъпен, отворен и взаимосвързан (показващ връзките между фирми, управители, местоположения, регулаторни и съдебни дела). Полученият масив ще позволи всички тези факти да се свържат лесно с други отворени източници като Geonames (всички географски обекти на Земята), DBPedia (структурирана версия на Wikipedia), Wikidata, OpenCorporates… Създаването на "новия" формат на Търговския регистър може да го направи по-прозрачен и информативен за бизнеса, както и по-лесен и ефективен за търсене от изследователи и журналисти. По този начин ще се подпомогне и борбата с корупцията.

За участието в Datathon 2017 "Онтотекст" ще си партнира с OpenCorporates – най-голямата отворена база данни от компании и бизнес информация в света, с над 120 милиона фирми от над 100 държави. Самият Datathon Bulgaria ще се проведе между 24 и 26 март в Софияq като отборите, стигнали до най-прецизно, креативно и елегантно решение на проблемите, свързани с обработка и анализ на данни, ще бъдат наградени.

Facebook
Twitter
LinkedIn
Telegram
WhatsApp

Още от категорията..

Последни новини

Уместно ли е предложението на финансовия министър Людмила Петкова да се облагат „свръхпечалбите“ на банките?

Подкаст