Оливер создал репозиторий, кода там нет, но регулярно обновляет статьи, есть возможность создавать ветки, в которых, правда, еще не отвечал (c 2018), см. github. Скачать дамп базы 2018.
код парсер Оливера + выпарсенные данные на 2017 (без учета обновлений 2019) , см. github, похоже частично устарело после дамп базы 2018.
отчеты о плохой работе гулговского OCR, комментарий к каждому плохо распознанному документу подается отдельной веткой. Ежемесячно гугловцы будут его просматрывать начиная с марта 2021 г., см. github.
Наше
возродить десктопную словарную оболочку Артема, см. github.