* С чего начать
Раз за разом на этот вопрос и просто опытные и даже титулованные журналисты отвечают одинаково: с поисковиков – «Яндекс» и Google.
Поэтому для начала учимся правильно задавать вопросы. Тут инструкция, как вводить запросы в «Яндексе», а здесь подсказки Google.
* Соцсети
Про них тоже все знают. Facebook, «ВКонтакте», Instagram, Twitter, Telegram. Обращать внимание стоит на:
- даты появления сообщений и фотографий;
- геометки (расскажут, где отдыхают дети чиновников, где дачи у олигархо, в каких увеселительных заведениях их искать по пятницам…);
- друзей (и тех, кто часто «лайкает», комментирует, отмечен на общих фото).
declarator.org
* Финансы
declarator.org – проект Центра «Трансперенси Интернешнл — Россия». В одном месте собирается информация из открытых деклараций госслужащих. Сразу можно найти данные за несколько лет.
* Недвижимость
Выписки из ЕГРЮЛ/ЕГРИП – содержат актуальную информацию об учредителях компаний. А тутсобраны ссылки на похожие иностранные реестры.
Росреестр - На сайте доступна публичная кадастровая карта, на которой можно узнать сведения о земельных участках и объектах недвижимости, например, подо что можно использовать указанные земли (может быть важно, допустим, если где-то начинается новое строительство), их кадастровую стоимость, кадастровый номер.
РГИС (Региональная геоинформационная система) – кадастровая карта Петербурга с дополнительными полезными сведениями (например, можно запросить паспорт ГАТИ)
Ссылки на Федеральные и региональные Геопорталы России в одом месте можно посмотреть тут
rosreestr.ru
* Суды
Все суды Петербурга собраны на общем сайте, оттуда можно попасть на порталы конкретный судов, а уже на них посмотреть информацию о рассматриваемых делах.
База судебных актов www.sudact.ru. Еще один источник информации о решениях судов и движении дел.
* Карты и здания
Карты «Яндекса» и Googleсодержат помимо собственно карт, панорамы и фотографии пользователей. Последние пригодятся для поиска информации о том, что было в нужном месте месяц, год или пять лет назад – как менялись вывески магазинов, фасады зданий.
wikimapia.org – карту редактируют обычные пользователи. На ней можно найти интересные уточнения, в том числе сообщения о хозяевах зданий, народные названия мест и т.п.
citywalls.ru – сайт по историческим и более-менее интересным современным зданиям в Петербурге. По старым домам найдется информация о годах постройки, жильцах, интерсеных эпизодах из истории. По новым строениям указаны в том числе заказчики строительства, архитекторы (компании), застройщики. Пользователи также собирают информацию о перипетиях в судьбе зданий за последние годы.
Распоряжения ГАТИ – позволяют понять, что происходит в городе, например, из-за чего перекрыли дорогу. Если же проезд закрыт, а ГАТИ об этом ничего не сообщает – это повод для выяснений, кто и зачем копает, строит, мешает горожанам.
wikimapia.org
* Расходование бюджетных средств
ГосЗакупки – единая информационная система в сфере государственных закупок – контрактов, торгов, аукционов и т.п. с текстами ТЗ, заключенных договоров, информацией о заказчике и исполнителях.
ГосЗатраты – еще один сайт поиска информации по госконтрактам, только созданный «Комитетом гражданских инициатив».
* Базы данных о юридических лицах
Сервер раскрытия информации «Интерфакс» - кроме прочего там же некоторые компании выкладывают финансовую отчетность
Порталы «За честный бизнес» и rusprofile
Платные и частично платные базы
СПАРК
Картотека Коммерсант
Контр.Фокус
Корус
read.infometer.org
* Источники открытых данных по разным вопросам
- Государственная статистическая служба gks.ru и fedstat.ru
- Порталы открытых данных data.gov.ru, opendata.open.gov.ru, hubofdata.ru
- Подборка сайтов с открытыми данными со всей России – Инфометр
* Как отправлять запросы и получать данные
Еще один полезный сервис от «Инфометра» - «Шпаргалка: как запросить открытые данные у государства». Советы рассчитаны не столько на журналистов, сколько на всех людей, но также может пригодиться при ведении расследований и исследований.
* Солнечный калькулятор
www.suncalc.org – полезный сервис для проверки (уточнения) места и времени съемки фото или видео по тени
* Когда вся информация найдена
… но ее еще как-то нужно вытащить из интернета (если речь о больших объемах, которые, например, представлены в таблицах, PDF, картинках):
Распознавание графических изображений - convertio.co/ru/ocr/
Парсинг (извлечение данных)
- из PDF - Tabula
- с сайтов - import.io (бесплатно доступны 500 запросов в месяц)
- web scraper - плагин для Chrome
- outwit hub – плагин для Mozilla
При подготовке материала использована информация из докладов основателя Data Storytellers, экс-руководителя дата-спецпроектов РБК Александра Богачева, экс-корреспондента газеты «Деловой Петербург», занимавшейся антикоррупционными расследования Светланы Зобовой, главного редактора Roem Юрия Синодова.
Митап проходил в школе «Маяк» (Новая Голландия) и был организован КОРУС Консалтинг СНГ
Источник: текст и фото Lenizdat.ru