AntiqGPT. Неожиданное применение этих ваших LLM

  • Автор темы Автор темы MORGAN
  • Дата начала Дата начала

MORGAN

Активный пользователь
Регистрация
04.06.2025
Сообщения
1 179
Реакции
1 068
Баллы
113
Недавно я вернулся из отпуска, который проводил в Турции недалеко от Анталии. В один из дней мы с семьёй оставили уютный олл-инклюзив и отправились посмотреть руины древнего греческого города Фаселис, расположенные неподалёку.

Какой ордер у колонны?

Какой ордер у колонны?
Бродя по этим живописным заросшим лесом развалинам, окруженным бухточками, на бывшей городской площади я сфотографировал вот эту каменную плиту:

Послание сквозь 2000+ лет. Меня завораживают такие штуки.

Послание сквозь 2000+ лет. Меня завораживают такие штуки.
Несмотря на повреждения, часть текста осталась вполне читабельной. Ещё каких то пять лет назад, без знания койне, при отсутствии рядом музейной таблички с расшифровкой, понять о чём тут речь было бы абсолютно невозможно.

Древние оставили нам много текстов, большая часть из них всё ещё не расшифрована. В одной только Турции известны многие десятки (возможно сотни) греческих, римских, византийских, фригийских, лидийских, хеттских и других древних городов.

Локации некоторых руин в Турции

Локации некоторых руин в Турции
В базах данных греческой эпиграфики содержится свыше 100 000 надписей, из которых около трети имеют значительные лакуны или повреждения. Классический подход к расшифровке требует от эпиграфиста:

- Знание палеографии (эволюции письма) для каждого региона и периода
- Понимание локальных диалектов и особенностей языка
- Знакомство с историческим контекстом конкретного места
- Интуицию для восстановления смысла по отдельным буквам

Даже опытный специалист может потратить на одну надпись несколько недель, при этом результат порой остается гипотетическим. В мире есть вероятно пара сотен специалистов, способных профессионально работать с древнегреческими надписями. При текущих темпах работы полная обработка только уже накопленного материала займет столетия, а ведь коллекция постоянно пополняется новыми находками.

Подумав об этом (пять лет назад) я бы просто пошёл себе дальше осматривать руины. Но теперь у меня в кармане есть инструмент, который содержит в себе "знание" огромного корпуса известных древних текстов. Называется он LLM, большие языковые модели, в простонародье "Искусственный Интеллект".

Значит надо скормить фотку нейронке и посмотреть, что будет.

Первым на очереди был DeepSeek, который заявил, что у него лапки.
Claude узнал греческий текст, но отказался его расшифровывать.
ChatGPT оказался куда более сообразительным:

На изображении представлена древняя каменная стела с надписью на древнегреческом языке, высеченная в стиле эпиграфики классического или эллинистического периода. Надпись достаточно повреждена, особенно в центральной и нижней части, но видны характерные буквы греческого алфавита (Α, Ε, Η, Ο, Π, Σ, etc.), написанные без пробелов и диакритики, как это было принято в древних надписях.


Попробуем начать с частичной расшифровки сохранившихся строк в верхней части, где надпись читается лучше. Учти, что в силу эрозии и сколов камня это будет лишь реконструкция, а не дословный перевод:

[Отлично, давай!]​

Примерная транслитерация (первые строки):
...ΑΡΧΟΝΤΟΣ ΕΠΙ ΤΗΣ ΠΟΛΕΩΣ <br>ΚΑΙ ΕΠΙ ΤΩΝ ΙΕΡΩΝ ΚΑΙ ΤΗΣ <br>ΓΑΜΑΣ ΤΗΣ ΑΝΕΦΗΝΕΝ <br>...ΝΑΓΙΛΛΟΥ ΙΩΝΟΣ <br>ΕΔΩΚΕ ΤΩΝ ΧΡΗΜΑΤΩΝ...
Примерный перевод:

"...во время архонства (власти) над городом,""и над святилищами, и (вероятно) браком (или обрядом посвящения),""(некто) посвятил (или сообщил, объявил)...""(имя, возможно Нагилл, сын Иона),""дал (или пожертвовал) из средств..."

Дальнейшие строки фрагментарны, но видны стандартные формулы, часто встречающиеся в греческих декретах, посвятительных надписях или общественных постановлениях. Такие надписи могли фиксировать:

решения городского совета (βουλή),общественные благодарности,пожертвования граждан,строительные работы или реставрации храмов.

Что можно сделать дальше для полноценной расшифровки:

Повысить контраст изображения для лучшего чтения букв.Выполнить 3D-модель поверхности (если возможно) — часто используется при археологических исследованиях.Сравнить видимые строки с базами древнегреческих надписей, например, PHI Greek Inscriptions или [SEG (Supplementum Epigraphicum Graecum)].
ChatGPT обучен на корпусе древнегреческих текстов, включающем произведения от Гомера до византийских авторов. Модель "знает" не только словарь и грамматику, но и типичные формулировки эпиграфических текстов: посвящения богам, почетные декреты, надгробные эпитафии. Когда нейронка "видит" фрагмент она анализирует контекст и предлагает варианты завершения, основываясь на тысячах похожих надписей в своих исходных данных.

[Сделай OCR-распознавание, а затем на его основе реконструируй полный возможный текст]​

Верхние 5 строк (визуальное чтение и транслитерация):

(частично утрачена)
<em>... ΗCΑΡΧΟΝΤΕCΕΠΙΤΗCΠΟΛΕ...</em>
Транслитерация: <em>...ēs archontes epi tēs pole[ōs]</em>
→ "...в правление архонтов над городом..."
<em>ΚΑΙΕΠΙΤΩΝΙΕΡΩΝΚΑΙΤΗC...</em>
Транслитерация: <em>kai epi tōn hierōn kai tēs...</em>
→ "и над святилищами, и..."
<em>ΓΑΜΑΤΗΝΕΑΝΑΘΗΚΗΝ...</em> Транслитерация: <em>gama tēn neanathēkēn</em> (возможно ошибочное разбиение) Вариант: <em>ἐγαμα τὴν νέα ἀναθήκην</em>
→ "освятил новый дар (или: посвящение)"
<em>...ΝΑΓΙΛΛΟΥΙΩΝΟC</em> Транслитерация: <em>...Nagillou Iōnos</em>
→ "…(имя), сын Иона"
<em>ΔΩΚΕΤΩΝΧΡΗΜΑΤΩΝ...</em> Транслитерация: <em>edōke tōn chrēmatōn</em>
→ "пожертвовал из своих средств..."

Итоговый реконструированный перевод на русский язык​

"При архонтах, управлявших городом и святилищами, и надзирающих за посвящением, сын Никониона [имя отсутствует] пожертвовал из собственных средств. Он был почтён ранее и теперь также народом признан достойным чести за редкую доблесть. Решением совета и избранных постановлено учредить клятву и записать это постановление на каменной стеле, и установить её на площади навечно — в напоминание. Да не будет ничего ни добавлено, ни удалено с этой стелы вечно, по решению народа Фаселитов, как постановлено советом и народом, в знак добродетели."
Неплохо. Пусть это и очень приблизительная реконструкция, она даёт представление о назначении надписи и немного погружает в историческую эпоху.

Получив текст я попросил нейросеть создать изображение стелы как будто она только что изготовлена. И тут начались проблемы. Модель отказывалась сгенерировать такое количество текста без ошибок, путала буквы и слова, добавляет лишние строки, пробелы, знаки переноса, не может вместить строку на изображении полностью... Заметно, что генерация текста и изображений в ChatGPT делаются разными моделями, и их взаимодействие не всегда проходит гладко. Например, текстовая модель не видит ошибок на картинке, а при просьбе проверить - обращается не к изображению, а к исходному текстовому фрагменту, а потом смешно оправдывается.

В итоге в рамках одного чата мне так и не удалось получить картинку с текстом, соответствующим реконструкции. Встречались, в том числе вот такие странные штуки

Чат решил, что раз уж я занимаюсь электроникой, то изображение pcb-дорожек подключенных к шестеренке на древнегреческой стеле меня обрадует

ости своей реконструкции, качество итогового результата по-прежнему зависит от экспертизы исследователя. При этом ИИ может в тысячи раз повысить скорость работы, мгновенно генерируя гипотезы, таким образом принести реальную пользу в изучении прошлого.
 
Назад
Верх