Archive for Сентябрь, 2021

PDF в HTML

Среда, 29 сентября, 2021

Потребовалось преобразование PDF в HTML на скорую руку, но большинство онлайн преобразователей делает слишком большой размер и запихивает картинки в html через base64. В общем вот один из вариантов который меня устроил:

В начале конвертируем PDF to HTML https://www.zamzar.com/ru/convert/pdf-to-html/ (в html5)

Если вдруг сайт перестанет работать, вот исходный проект на git: https://github.com/coolwanglu/pdf2htmlEX/

Из html файла по шаблону удаляем конструкции типа:

<span class="_ _0"></span>

и им подобные, поcле чего html становится более менее понятным и значительно меньше по весу.

Затем конвертируем png в webp (например сайты https://cloudconvert.com/ и https://onlineconvertfree.com/ru/complete/png-webp/ у них у обоих есть ограничения, но жмут хорошо)

Затем в html меняем .png на .webp

Приводим html в читаемый вид.
https://serblog.ru/demo/format-html/

Все, остальное по вкусу.