Нередко в процессе учёбы или работы незрячие пользователи сталкиваются с информацией в недоступном или в неудобном формате. Например: ещё недавно, чтобы сделать читаемым для скринридера скан учебника или какого-либо документа в формате pdf, приходилось использовать на компьютере ресурсоёмкую и дорогостоящую программу Abbyy FineReader. Теперь эту и другие задачи по конвертации файлов решает бесплатный онлайн-сервис «Данные в данные».
О проекте
Около двух лет назад незрячий веб-разработчик из Санкт-Петербурга Артём Плаксин с коллегами Данилом Пылаевым и Бекой Гозалишвили создал сервис «Данные в данные». В настоящее время этот сервис предлагает три вида конвертации файлов, востребованных людьми с нарушением зрения:
- Изображения в текст;
- Текст в речь;
- FB2 в TXT.
Важная особенность сервиса «Данные в данные» заключается в том, что не требуется ничего устанавливать на ваш компьютер. Взаимодействие с сервисом происходит через браузер, а вся работа выполняется на сервере. Причём максимальный объём загружаемых файлов: 10 ГБ. Сайт полностью доступен для незрячих пользователей.
Как пользоваться?
- Прежде всего, стоит пройти простую регистрацию на сайте. Она нужна для того, чтобы не вводить email всякий раз, когда надо загрузить файл на сайт и получить результат конвертации. Также в учётной записи будет доступна история запросов (какие файлы когда преобразованы, готов ли результат к скачиванию).
- Выбираем задачу: изображения в текст; текст в речь или FB2 в TXT.
- Указываем желаемые параметры и загружаем файл, который надо преобразовать.
- После завершения процесса конвертации получаем по электронной почте ссылку на готовый файл. Результаты конвертации доступны для скачивания по ссылке в течение недели.
Для каждой задачи, безусловно, параметры свои.
Преобразование изображения в текст
Документы в формате PDF доступны незрячим пользователям только при наличии текстового слоя. К сожалению, документ в формате pdf — это зачастую просто снимок: визуально текст есть, для видящих пользователей этого достаточно, чтобы прочитать информацию, а вот для скринридеров это лишь изображение. Незрячему человеку текст с него не прочитать без оптического распознавания, как и с фотографии текста, например, в формате JPG. Здесь поможет конвертация изображения в текст.
- Можно выбрать язык документа. По умолчанию выставлен русский, но, если документ двуязычный, например, сборник упражнений по английскому языку, где задания на русском, а тексты упражнений на английском, выбирайте в качестве второго языка английский.
- Далее можно выбрать формат готового файла, качество распознавания (быстрое или наилучшее).
Важно учитывать, что результат распознавания зависит от исходного качества изображения.
Также, преобразование изображения в текст позволяет распознать файл DJVU.
Конвертируем текст в речь
Файлы FB2 или TXT можно преобразовать в аудиофайлы, где текст будет начитан синтезатором речи. Это даст возможность прослушать текст даже в самом простом плеере.
- Нужно выбрать предпочитаемый голосовой движок (RH Voice или Espeak) и голос, которым будет озвучен текст. Лаборатория RHVoice Lab во главе с Артёмом Плаксиным уже разработала более десяти голосов для синтезатора RHVoice. Есть голоса для русского, английского, татарского, украинского и других языков. Чаще всего, пользователи выбирают голос «Александр» или «Павел».
- Если текст двуязычный, можно выбрать различающиеся варианты синтезатора речи для первого и для второго языка.
- Далее выбираем высоту, скорость и громкость синтезатора речи.
- Теперь определяем формат готового файла: MP3 или OGG.
- Осталось указать: нужно ли разделять наш текст на фрагменты или хотим получить его одним аудиофайлом. Причём если исходный файл формата FB2, то можно разделить аудиозапись на файлы по главам.
Конвертация FB2 в TXT
Электронную книгу в формате FB2 можно открыть только в специальных приложениях, которые не всегда удобны незрячим пользователям и такой программы просто может не оказаться на вашем устройстве, а книгу нужно прочитать. Для этого, например, можно преобразовать книгу в файл TXT, с его открытием точно проблем не возникнет.
Примечательно, что сервис «Данные в данные» сохраняет внутреннюю структуру папок в архиве. Если мы загружаем книжную подборку, в которой все книги рассортированы по авторам/сериям/жанрам, то на выходе получим архив с точно такой же структурой, только вместо FB2 будут файлы TXT. А совсем недавно на сайте в тестовом режиме появилась возможность конвертации FB2 в HTML.
Статистика
За неполные два года работы сервиса «Данные в данные» уже выполнено:
- Преобразование текста в речь: 1934 задачи.
- Преобразование изображения в текст: 1261 задача.
- Преобразование FB2 в TXT: 387 задач.
Ссылка на сайт «Данные в данные».
Благодарим Вас за внимание! Пожалуйста, поделитесь с друзьями в соцсетях.