Потребовалось преобразование PDF в HTML на скорую руку, но большинство онлайн преобразователей делает слишком большой размер и запихивает картинки в html через base64. В общем вот один из вариантов который меня устроил:
В начале конвертируем PDF to HTML https://www.zamzar.com/ru/convert/pdf-to-html/ (в html5)
Если вдруг сайт перестанет работать, вот исходный проект на git: https://github.com/coolwanglu/pdf2htmlEX/
Из html файла по шаблону удаляем конструкции типа:
<span class="_ _0"></span>
и им подобные, поcле чего html становится более менее понятным и значительно меньше по весу.
Затем конвертируем png в webp (например сайты https://cloudconvert.com/ и https://onlineconvertfree.com/ru/complete/png-webp/ у них у обоих есть ограничения, но жмут хорошо)
Затем в html меняем .png на .webp
Приводим html в читаемый вид.
https://serblog.ru/demo/format-html/
Все, остальное по вкусу.