Текст и знание в гуманитарных науках в эпоху больших языковых моделей¶

Борис Орехов

НИУ ВШЭ, ИРЛИ РАН

Порождение текста¶

  • Нейросети производят тексты.
  • С появлением ChatGPT всё чаще обсуждается, смогут ли нейросети заменить писателей, программистов и учёных.
  • Эти профессии объединяет то, что все они в том числе порождают тексты.
  • Для писателей и программистов тексты более-менее единственный результат деятельности.
  • Языковые модели хорошо восстанавливают из дискурса закономерности таких текстов и дублируют их работу.

Напиши первые три предложения рассказа об университетском преподавателе, который решил стать продавцом мороженого

Университетский преподаватель по имени Джон долгое время работал в университете, преподавая философию. Он был очень увлечен своей работой, но всегда мечтал о другой профессии - продавце мороженого. Он любил мороженое с детства и всегда мечтал иметь свой магазинчик с этим десертом.

In [1]:
# Here is a sample code that can be used to download all images 
# from a webpage using Python:

import requests
from bs4 import BeautifulSoup
import os

response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
image_tags = soup.find_all("img")
if not os.path.exists("images"):
    os.makedirs("images")
for img in image_tags:
    img_url = img.attrs.get("src")
    if not img_url:
        continue
    img_name = os.path.join("images", img_url.split("/")[-1])
    try:
        img_data = requests.get(img_url).content
        with open(img_name, "wb") as f:
            f.write(img_data)
    except:
        print(f"Failed to download {img_url}")

А ученые?¶

Определение науки по ChatGPT:

Наука - это систематический и организованный подход к изучению природы, общества и различных явлений, основанный на наблюдении, экспериментах и логическом анализе данных. Цель науки - расширение знаний и понимания мира, создание новых технологий и решение практических проблем.

Ни слова о текстах

  • Ученые производят знание или тексты?
  • В идеализированном схематичном мире — знание.
  • А на самом деле publish or perish.
  • Можно ли разделить текст и знание?
  • Если да, то ученым в отличие от программистов и писателей нечего опасаться со стороны нейросетей.
  • Если нет, то это порождает другие неприятные вопросы:
    • а существует ли знание?
    • есть ли отличия между учеными и писателями?

Естественные и гуманитарные науки¶

  • Находятся ли ученые разных наук в разном положении?
  • Кажется, что имитировать гуманитарный текст проще, чем естественнонаучный.
  • Благодаря работам Латура и кризису воспроизводимости мы знаем, что исследование трудно отделить от лаборатории, в которой оно было воспроизведено.
  • Отчуждаемо ли то, что сказано в статье о химии и физике, от текста статьи?

наука берется <...> не только как сумма идей, опытов, знаний, но и как научная литература, а каждое научное сочинение рассматривается не только как изложение определенных взглядов на явление природы, но и как текст на естественном языке, где образ и стиль имеют фундаментально-определяющее значение для воссоздаваемой картины мира и построений теории.

Гачев Г. Д. Наука и национальная культура (гуманитарный комментарий к естествознанию). Ростов-на-Дону, 1993.

Возможно, ничем иным она и не является.

Естественные науки пользуются формальными языками

formula

Из статьи Alloying at a Subnanoscale Maximizes the Synergistic Effect on the Electrocatalytic Hydrogen Evolution

Высказывание на формальном языке точно так же можно имитировать:

реакция между металлом натрием (Na), спиртом этанолом (C2H5OH) и сахаром глюкозой (C6H12O6) может быть записана следующим образом:

2Na + C2H5OH + C6H12O6 → 2C2H5OH + 2NaOH + CO2

(ChatGPT)

  • Возможен ли нарратив, пересказывающий формулу?
  • Если да, то знание в естественных науках отчуждаемо от текста.
  • Если нет, то проблема статуса знания общая для всех наук.
  • Непрофессионалу кажется, что да.
  • Ученому-естественнику может представляться, что нет.
  • Даже если нет, остается семиотическая проблема соотнесенности с реальностью:
    • правда ли было совершено наблюдение, о котором написано в тексте?
    • правда ли был проведен эксперимент, о котором написано в тексте?

Проблема гуманитариев¶

  • Гуманитарное знание не отчуждаемо от текста.
  • Глубоко индивидуализированные работы Бахтина, Гаспарова, Тюпы.
  • Забытые идеологизированные работы советского времени.
  • Даже позитивистское знание биографического (встретил ли Пушкин тело Грибоедова?) и текстологического характера не существует отдельно от своей аргументации, «зашитой» в текст.
  • В отличие от ситуации естественных наук, для наблюдения не нужны специальные условия, а эксперимент отсутствует.
  • До нейросетей эта проблема не ощущалась так остро.
  • Пока языковые модели плохо анализируют тексты.
  • Но это не надолго.

Поэтический текст наполнен символами и метафорами, которые создают особую атмосферу тайны и загадочности. Ночь, улица, фонарь и аптека – это не только конкретные объекты, но и символы одиночества, тоски, жизненной боли и страдания.

Строфы стихотворения построены на повторении одинаковых фраз, что создает эффект монотонности и однообразия, подчеркивая тяжесть и усталость души.

В целом, поэтика стихотворения "Ночь. Улица. Фонарь. Аптека..." отличается высокой степенью символизма и метафоричности, что позволяет передать сложность человеческого существования и его неизбежную трагическую сторону.

Так было не всегда¶

  • Для Платона форма диалога была не окончательной формой выражения учения.
  • Любая письменная форма уязвима для философии (критика письма в «Федре»):
    • книга не может за себя постоять;
    • книга всегда говорит одно и то же;
    • книга не ориентирована на собеседника

См. Слезак Т. А. Как читать Платона. СПб., 2008

Критика ChatGPT у Платона¶

«Евтидем», 289b и далее:

— Следовательно, прекрасный мой мальчик, — продолжал я, — мы нуждаемся в таком знании, в котором сочеталось бы уменье что-то делать и уменье пользоваться сделанным.

— Это ясно, — отвечал он.

— Значит, как видно, нам вовсе не нужно {C} становиться искусными в изготовлении лир и сноровистыми в подобном уменье. Ведь здесь искусство изготовления и искусство применения существуют порознь, хотя и относятся к одному и тому же предмету, ибо искусство изготовления лир и искусство игры на них весьма отличаются друг от друга. Не так ли?

— Но, во имя богов, — сказал я, — если мы изучим искусство составления речей, то именно приобретение этого искусства сделает нас счастливыми?

— Я этого не думаю, — отвечал Клиний, схватив {D} мою мысль.

— А как ты можешь это обосновать? — спросил я.

— Я знаю некоторых составителей речей, не умеющих пользоваться собственными речами, которые сами они сочинили, подобно тому как изготовители лир не умеют пользоваться лирами. В то же время есть другие люди, умеющие пользоваться тем, что первые приготовили, хотя сами приготовить речи не умеют. Ясно, что и в деле составления речей искусство изготовления — это одно, а искусство применения — другое.

— Мне кажется, — сказал я, — ты достаточно веско доказал, что составление речей — это не то искусство, обретя которое человек может стать счастливым. А я уж подумал, что здесь-то и явится нам знание, которое мы давно ищем. Ведь мне и сами эти мужи, сочинители {E} речей, кажутся премудрыми, и искусство их — возвышенным и волшебным. Да и не удивительно: оно — как бы часть искусства заклинаний и лишь немного ему {290} уступает. Только искусство заклинателей — это завораживание гадюк, тарантулов, скорпионов и других вредных тварей, а также недугов, а искусство сочинителей речей — это завораживание и заговор судей, народных представителей и толпы

Оригинальность и посредственность¶

  • Нейросети продуцируют «среднее арифметическое» от обучающих данных. См. продавца мороженого.
  • Всё оригинальное — это ошибки.
  • Хорошо или плохо это для науки?
  • Если текст языковой модели достаточен, значит, наука — это всего лишь технология (τέχνη).
  • Может быть, сложная, но потенциально постижимая.
  • Для Платона такой была диалектика.
  • Оригинальность и гениальность ученого — мифология эпохи романтизма.
  • Замешательство перед успехом нейросетей — это замешательство перед тем, что миф не оправдывается.

Как говорить о нейросетях¶

  • Вопрос с ответом.
  • Гуманитарная наука ищет язык для разговора о продукции нейросетей.
  • В основном мы кружимся вокруг сходства текстов естественного и искусственного происхождения.
  • Насколько удачен косплей? Бесконечный тест Тьюринга.
  • Мне кажется, стоит сосредоточиться
    • на различиях
    • на поиске источников стилистических и семантических интервенций
  • Шахматисты умеют отличать компьютерные ходы от человеческих.
  • В чем машинность «ходов» при порождении текста?

Курсовая работа по истории России на тему: «Промысел Божий и дьявольские козни в Повести временных лет»

Чудеса являются неотъемлемой частью картины мира древнерусских жителей

древнерусские жители

Актуальность темы исследования определяется постановкой новых задач в деле государственного реформирования, среди которых на особом месте стоит обращение к опыту прошлого

Для естественного интеллекта начинающего историка на первом курсе троп «чтобы избежать ошибок прошлого» является почти аксиомой.

Задачи госреформирования в этом поле «машинные».

Сайт, на котором собраны важные для меня проекты, тексты и выступления.

nevmenandr.net

Выражаю признательность А. Ю. Володину и О. В. Алиевой.