Readability — сервис для оценки читаемости текста

Readability-оценка текстов-читаемости текстов-Readability.io — разработка специалиста по работе с данными и апологета data в России Ивана Бегтина. Он создал простой инструмент для проверки читаемости текста. 

Сервис Readability.io позволяет проверить, насколько читаемым и простым для понимания получился напечатанный или опубликованный текст.

Текст оценивается по балльной шкале и ее пересчету на возраст аудитории, которой будет удобно его читать.

Например, можно встретить категории читателей:

  • «7–9 класс; 12–14 лет»
  • «10–11 класс; 15–16 лет»
  • «1–3 курсы вуза; 17–19 лет»
  • «4–6 курсы вуза; 20–22 лет»
  • «Аспирантура, второе высшее образование, phD»

Уровень читаемости показывает не то, насколько комфортно читается тот или иной текст, а то, насколько высоким должен быть уровень его потенциального читателя.

Предполагается, что сервис будет полезен райтерам, разработчикам сайтов и журналистам. С его помощью они смогут «определить удобство чтения материалов сайта, брошюр, руководств и книг и своевременно внести необходимые исправления».

Были накоплены тексты на русском языке с разметками по уровню чтения, это:

  • тексты для внеклассного чтения;
  • экспертно размеченные взрослые тексты;
  • особо сложные тексты законов;

В расчёте используется пять формул читаемости, адаптированные для русского языка:

  1. Flesch-Kinkaid
  2. индекс Колман-Лиау
  3. Automatic Readability Index
  4. SMOG
  5. формула Дэйла-Чейла

Помимо степени читаемости, сервис рассчитывает показатели по всем пяти формулам, а также считает число знаков, количество длинных и процент сложных слов от общего числа, а также другие количественные величины.

Все алгоритмы были обучены под русский язык — специальным образом каждая формула была подобрана на основе обучающей выборки. Для всех формул были применены коэффициенты, позволяющие применять их к русским текстам.

На базе этих формул был сделан специальный веб-сервис который позволяет передавать ему текст или ссылку и оценивать его на сложность.

Комментарий Ивана Бегтина, автора сервиса Readability, для best app:

«Считается что чем текст проще написан тем для более необразованной аудитории он понятнее в восприятии. Главное измерение здесь даже не возраст, а число лет обучения. Для какой аудитории следует писать тексты? Для той, на которую Вы нацелены. Если текст нацелен на рядовых граждан, то неплохо бы писать его понятным человеку без высшего образования. Если это научная статья, то она может быть и довольно сложной. Если инструкция для солдат, то лучше ориентироваться на уровень 9-го класса школы.
Сервис я сделал, потому как занимаюсь этой темой давно, а в этом случае просто не удержался, накопилось много наработок.

Сложно ли сделать? Технически не очень. Больше всего времени ушло на то, чтобы правильно перестроить/переобучить алгоритмы так, чтобы они соответствовали русскому языку. Это довольно трудоёмкая задача, но вполне выполненная и завершенная».

Скринкаст, как пользоваться Readability для оценки читаемости текста

Видео