О скорой пользе чата GPT для бухгалтеров
В своих упражнениях с ИИ по чату GPT натолкнулся на один кейс, который поможет облегчить жизнь бухгалтеров.
Дело в том, что некоторые банки (не российские) имеют вредную привычку высылать выписку только в формате PDF.
Я частично автоматизировал бухгалтерам загрузку через приложение PDF2TXT.
Но на выходе получается не всегда точный текст документа, хотя PDF и строгий формат, но даже разметка далека от табличной.
В то же время сейчас, если отдать чату GPT файл PDF, он нормально его распознает, и может выдать результат даже в JSON-формате.
Единственная проблема в том, что чат GPT недоступен в России, а посредник VseGPT работает только с текстовыми запросами, максимум с картинками. Можно, конечно, PDF конвертировать в JPG, но это лишнее звено.
Надо искать, какая отечественная сеть умеет работать с файлами напрямую, может Сбер? И тогда бухгалтеры смогут отдохнуть от рутины.

FineReader добывать данные из PDF умел и до GPT. Вообще, это довольно отработанная тема. Тут модельки не сильно нужны.
а добывает так же кривовато, как pdf2text?
Он платный. За удобство надо платить, но работать будет существенно лучше бесплатных аналогов.
тут еще вопрос цены интеграции. у него есть утилита командной строки? вряд ли, нужно API использовать и т.п.
хотя допустим он поддерживается типовыми, то бишь должна быть функция «Распознать PDF», но документирована ли она?