НАУЧ-ПОП2026-04-19~5 мин

Движок vs LLM: почему Mindloom — это не ChatGPT для психологии

Чем специализированный аналитический движок принципиально отличается от большой языковой модели — и почему мы используем LLM внутри, но не доверяем им интерпретацию

Mindloom Research

engineLLMarchitecturemethodology

Вопрос, который нам задают чаще всего

«А чем это отличается от того, чтобы просто спросить ChatGPT?»

Справедливый вопрос. Давайте разберёмся.

Когда вы просите языковую модель проанализировать текст — она генерирует правдоподобный ответ. Каждый раз заново. Каждый раз немного другой. Иногда блестящий. Иногда — уверенно неправильный. Вы не можете отличить одно от другого, потому что модель не различает тоже.

Когда текст анализирует Mindloom — он классифицирует. Не придумывает интерпретацию, а находит место текста в заранее построенной карте. 10 речевых режимов. 57 защитных механизмов. 8 паттернов включённости. Каждый элемент этой карты имеет определение, граничные условия, и критерии отличия от соседних элементов.

Это разница между тем, кто рисует карту по памяти каждый раз заново, и тем, кто сверяется с атласом.

Пять принципиальных отличий

1. Воспроизводимость

Один и тот же текст, поданный в Mindloom сегодня и через месяц, даст один и тот же результат. Режим BUILD останется BUILD. Защита NORMALIZATION останется NORMALIZATION. Напряжение 73% останется 73%.

LLM не даёт таких гарантий. Спросите ChatGPT один и тот же вопрос дважды — получите два разных ответа. Для творческих задач это преимущество. Для аналитических — это проблема. Терапевт не может полагаться на инструмент, который меняет своё мнение при каждом запуске.

2. Онтологическая заземлённость

Mindloom не может «придумать» новый защитный механизм. Он работает в рамках исследованной и зафиксированной таксономии — 57 классов, организованных в 7 функциональных категорий. Каждый класс имеет определение, речевые маркеры, и список классов, с которыми его можно перепутать (и почему нельзя).

LLM может выдать любой термин, который встречался в обучающих данных — корректный, устаревший, или вовсе несуществующий. И всё это будет звучать одинаково авторитетно. Mindloom не умеет звучать авторитетно по поводу того, чего нет в его онтологии. Это не ограничение — это принцип.

3. Прозрачность

Когда Mindloom определяет режим SEAL — вы можете проследить путь: какие ключевые слова сработали, какой score дала embedding-модель, какой вердикт вынес LLM-арбитр (и на основании каких маркеров). Каждый вывод — это цепочка решений, а не чёрный ящик.

Когда LLM говорит «здесь присутствует избегание» — вы не знаете почему. Может быть, потому что текст действительно содержит маркеры избегания. А может быть, потому что в обучающих данных похожие тексты часто сопровождались такой интерпретацией. Или потому что предыдущий контекст разговора подтолкнул модель в эту сторону.

4. Калиброванная уверенность

Mindloom знает, когда он не уверен. Если embedding-модель даёт два кандидата с близкими scores — система это видит и передаёт решение LLM-арбитру с контекстом. Если и арбитр не может различить — результат маркируется как неоднозначный.

LLM не имеет механизма калиброванной неуверенности. Модель может быть на 51% уверена — и представить результат с такой же убедительностью, как при 99%. Вы не видите разницу. Движок — видит, и показывает вам.

5. Провенанс

Каждый вывод Mindloom делится на два типа: текстово-заземлённые узлы (nodes) и гипотезы (hypotheses). Узел — это то, что движок увидел в тексте: конкретный речевой акт, конкретный маркер, конкретный режим. Гипотеза — это то, что движок предположил на основании паттерна: возможная скрытая потребность, слепое пятно, точка сборки.

Узлы имеют высокую уверенность и привязаны к конкретным фрагментам текста. Гипотезы имеют ограниченную уверенность (не выше 0.4) и явно маркируются как предположения. LLM не делает такого различия — факт и предположение подаются в одном потоке, с одинаковой уверенностью.

Ирония: мы используем LLM внутри

Да, Mindloom использует большие языковые модели. Но не как оракула, а как одного из трёх экспертов в системе.

Первый слой — ключевые слова. Быстрый, прозрачный, ограниченный. Ловит очевидное.

Второй слой — embedding-модель (SetFit). Видит семантическое пространство целиком. Даёт кандидатов. Не умеет объяснять.

Третий слой — LLM-арбитр. Подключается только когда первые два слоя не согласны или не уверены. Получает не открытый вопрос «что тут происходит?», а структурированный запрос: «embedding даёт SEAL с score 0.72 и VOID с score 0.68. Вот текст. Вот маркеры SEAL. Вот маркеры VOID. Вот граничные критерии. Какой из двух?»

Это принципиально другой способ использования LLM. Не генерация ответа из ничего, а арбитраж между конкретными кандидатами по конкретным критериям. Модель не придумывает — она выбирает. И мы можем проверить, правильно ли она выбрала.

Аналогия

LLM — это блестящий собеседник, который читал все книги по психологии и может обсудить что угодно. Он может подсказать, направить внимание, предложить перспективу. Но он не ведёт записей, не помнит, что говорил вчера, и может с равной убедительностью обосновать противоположные выводы.

Mindloom — это лабораторный инструмент. Он не ведёт разговоров. Он берёт текст и раскладывает его на составляющие — как спектрометр раскладывает свет. Что он видит — то он показывает. Чего не видит — молчит. Его результаты можно воспроизвести, сравнить, отследить во времени.

Это не конкуренция. Это разные инструменты для разных задач. Блестящий собеседник — для исследования и открытия. Спектрометр — для измерения и отслеживания.

Почему это важно

Потому что когда речь идёт о психическом здоровье, о понимании защитных механизмов, о работе с уязвимостью — «похоже на правду» не достаточно. Нужно «проверяемо, воспроизводимо, и знает свои границы».

Мы не строим замену терапевту. И не строим замену LLM. Мы строим инструмент, который делает невидимое видимым — и отвечает за каждое своё утверждение.

← ВСЕ СТАТЬИ