# Революция способа обучения: от скорости к размышлению > Первый и, возможно, самый технически значимый сдвиг 2025 года — внедрение Reinforcement Learning from Verifiable Rewards (RLVR) как базовой стадии обучения моделей. До 2025 года стек обучения LLM выгл Source: https://shipmint.kz/blog/shest-paradigmalnyh-sdvigov-2025 Published: 2026-02-25 Category: AI-стратегия --- ## TL;DR По оценке Андрея Карпатого, индустрия реализовала лишь 10% потенциала LLM — впереди ещё 90% пути. Cursor достиг $500 млн ARR, став самым быстрорастущим SaaS-продуктом в истории, а флагманские модели уже работают автономно 30+ часов. RLVR изменил парадигму обучения: модели-«мыслители» (o1, o3) теперь тратят время на поиск решения, а не мгновенную генерацию — это создало новый закон масштабирования через «вычисления во время инференса». Для казахстанского бизнеса 2026 год — последний момент начать работу с данными без критического отставания. --- ## Революция способа обучения: от скорости к размышлению - Качество важнее скорости: пользователи готовы ждать минут размышления, если получат правильный ответ вместо поверхностного суждения. - Новая модель ценообразования: модели с режимом размышления (o1, o3) требуют оплаты не за количество токенов, а за "время размышления" — за вычислительные ресурсы, потраченные на решение. Первый и, возможно, самый технически значимый сдвиг 2025 года — внедрение Reinforcement Learning from Verifiable Rewards (RLVR) как базовой стадии обучения моделей. До 2025 года стек обучения LLM выглядел стабильно: предварительное обучение, дообучение с учителем (SFT) и усиленное обучение от обратной связи человека (RLHF). RLVR изменил эту парадигму, добавив критически важный новый слой оптимизации, где модели обучаются на автоматически проверяемых наградах в таких областях, как математика и программирование. "Разницу в качестве уже можно было буквально почувствовать" — Андрей Карпатый о выпуске OpenAI o3. Что это означает практически? Модели научились спонтанно генерировать стратегии рассуждения, разбивая сложные задачи на промежуточные шаги вычисления и находя различные пути итеративного поиска решения. Первопроходцем здесь был OpenAI o1 (конец 2024 года), но настоящей точкой перелома стал выпуск o3 в начале 2025 года. Главная инновация заключается в новом регуляторе управления возможностями: времени размышления во время инференса. Вместо мгновенного генерирования ответа, модели теперь тратят больше вычислительных ресурсов на обдумывание проблемы — по сути, думают, как люди, пробуя разные стратегии и исправляя ошибки. Это создало новый закон масштабирования: способности модели теперь можно управлять как функцию тестовых вычислений путём генерации более длинных цепочек рассуждений. Для тех, кто строит бизнес на основе LLM, это означает две вещи: ## Интеллект, который одновременно гениален и легко обманывается Второй парадигмальный сдвиг — переосмысление самой природы интеллекта LLM. Карпатый назвал это явление «рваным интеллектом» (jagged intelligence). На протяжении лет исследователи описывали LLM как системы, похожие на человеческий мозг. 2025 год показал, что это ошибочная метафора. LLM — это совершенно иной тип интеллекта. Они могут быть гениальны в решении сложных проблем кодирования и математики, но легко "падают" перед простым джейлбрейком или запросом утечь данные. Это не похоже на человека, который либо умён, либо нет — это совсем другое явление. Нейросети оптимизированы под конкретные среды: люди — для выживания, LLM — для имитации текста и прохождения бенчмарков. По мере открытия верифицируемых доменов (математика, кодирование) для RLVR, способности LLM резко "взлетают" именно в этих областях, в то время как в остальном они демонстрируют "разрывы". Это привело к краху веры в традиционные бенчмарки. Они почти по определению являются верифицируемыми средами и сразу же становятся уязвимы для RLVR, позволяя моделям "наращивать рваность" для их прохождения. ## Cursor и рождение нового слоя приложений - Инженерию контекста: подготовку и структурирование данных для модели. - Оркестрацию вызовов: построение сложных DAG'ов (направленных ациклических графов) задач. - Балансирование: оптимизацию производительности и стоимости. - "Ползунок автономности": возможность настроить степень участия ИИ. Третий сдвиг — появление принципиально нового слоя LLM-приложений. Его символом стал Cursor — IDE с встроенным ИИ-ассистентом, который в 2025 году стал самым быстрорастущим SaaS-продуктом в истории, достигнув $500 млн ARR. LLM-приложения вроде Cursor объединяют и оркестрируют множество вызовов LLM под конкретные вертикали. Они делают: Появился паттерн "Cursor для X". Лаборатории LLM создают универсального "студента колледжа" (базовую модель), а прикладной слой дообучает его до "профессионала" для конкретной ниши, снабжая приватными данными и инструментами. ## ИИ переезжает на локальное: Claude Code и парадигма десктопа Четвёртый сдвиг — радикальное изменение среды обитания ИИ. Claude Code продемонстрировал LLM-агента, который работает прямо на вашем компьютере, в вашей приватной среде. Карпатый считает ошибкой концентрацию усилий OpenAI на облачных агентах. В мире с "медленным взлётом" и рваными возможностями логичнее запускать агентов на localhost, бок о бок с разработчиком. Это даёт низкую задержку, приватность и возможность работать с конкретной конфигурацией машины. ИИ становится не просто сайтом в браузере, а "духом", живущим в вашем компьютере. ## Вайб-кодинг: Код стал одноразовым ### Для новичков ### Для профи Пятый сдвиг — вайб-кодинг (vibe coding). Термин, рождённый из твита, к 2025 году стал реальностью. ИИ позволяет создавать работающие программы на естественном языке, почти "забывая" о коде. В классическом программировании код — это долгосрочный актив. Вайб-кодинг делает код одноразовым, пластичным, эфемерным. Нужно приложение для поиска бага? Попроси ИИ написать его, используй и выбрось. Код стал бесплатным. Возможность создавать сложные приложения без глубоких знаний синтаксиса, управляя процессом как "дирижёр". Масштабирование выпуска в 10 раз. Опытный разработчик может писать на незнакомом языке (например, Rust или C++) так же эффективно, как на своём основном. ## Nano Banana: Визуальный интерфейс для ИИ Шестой сдвиг — Google Gemini Nano Banana (gemini-2.5-flash-image-preview). Карпатый сравнивает LLM с компьютерами 80-х: им нужен был GUI, чтобы стать массовыми. LLM нужен визуальный интерфейс, так как люди предпочитают смотреть, а не читать текст. Nano Banana может генерировать изображения по тексту, редактировать фото с сохранением консистентности, создавать инфографику с актуальными данными и быстро итерировать. Главное здесь — совместная способность, возникающая из текста, изображений и знаний. LLM начинают общаться с нами через слайды, доски, анимации — на языке, понятном человеку. ## Что это значит для вашего бизнеса ### SEO и контент-маркетинг в эпоху ИИ ### Практические инструменты - Структурированные данные: Schema.org, JSON-LD обязательны. - Факты и цифры: "Скорость 1.2с" лучше, чем "быстро". - FAQ: Чёткие ответы на вопросы помогают алгоритмам. - Cursor: для быстрой разработки и прототипирования. - NotebookLM: для анализа документов и создания SEO-структур. - Nano Banana: для генерации [визуального контента](/blog/ai-prompt-engineering-visual-content-2026). - Claude Code / Local Agents: для приватной автоматизации задач. Классическое SEO уходит. Новая парадигма — AIO (Artificial Intelligence Optimization). Поисковики хотят давать готовые ответы. Чтобы ваш бизнес был к этому готов, начните с [создания цифровой основы](/services/digital-foundation) — современного сайта, аналитики и интеграций, которые поддерживают новые форматы поиска. ## Заключение: Только 10% потенциала Карпатый утверждает: индустрия реализовала лишь 10% потенциала LLM. Мы в самом начале пути. 2025 год — это не просто год ускорения, это год смены правил. Инвестиции в ИИ превысили нефтяные, стартапы растут с невероятной скоростью. Адаптация к этим сдвигам — необходимость. Пристегнитесь, впереди ещё 90% пути. ## Часто задаваемые вопросы (FAQ) ### Что такое RLVR в ИИ? ### Чем модели o1 и o3 отличаются от предыдущих? ### Что такое "вайб-кодинг" и почему код стал одноразовым? ### Как Nano Banana меняет взаимодействие с ИИ? ### Как адаптировать бизнес к этим сдвигам? Reinforcement Learning from Verifiable Rewards (RLVR) — это новый метод обучения, где модели учатся на автоматически проверяемых результатах (например, в математике или коде). Это позволяет им самостоятельно выстраивать стратегии рассуждений, получая четкую обратную связь "правильно/неправильно". Эти модели используют концепцию "времени размышления" (thinking time) во время инференса. Вместо мгновенной генерации ответа, они тратят вычислительные ресурсы на поиск решения, пробуют разные пути и проверяют ошибки, что радикально повышает качество ответов в сложных логических задачах. Вайб-кодинг — это программирование на естественном языке, где вы описываете задачу ИИ, а он пишет код. Код становится "одноразовым", потому что его легче сгенерировать заново под новую задачу, чем поддерживать и рефакторить старый. Это снижает барьер входа и ускоряет разработку. Модель Google Gemini Nano Banana предоставляет визуальный интерфейс. Люди лучше воспринимают информацию визуально, и эта модель умеет генерировать изображения, инфографику и слайды, объединяя текст, визуальные образы и знания о мире в единый ответ. Внедрять AIO для поиска, использовать инструменты вроде Cursor для ускорения разработки, применять локальных агентов для автоматизации рутины и следить за новыми визуальными возможностями моделей для маркетинга и коммуникации. ## Как шесть парадигмальных сдвигов меняют бизнес в Казахстане Каждый из шести сдвигов, о которых мы говорим, имеет прямое практическое измерение для казахстанского рынка. Давайте разберём конкретно. **Образование и переквалификация.** Казахстан активно инвестирует в AI-образование через Astana Hub и государственные программы. Но корпоративное обучение отстаёт: большинство компаний не имеют структурированных программ для перехода к AI-first работе. Это — окно возможностей для тех, кто начнёт обучать команду уже сейчас. **Производительность труда.** По данным международных исследований, компании, которые внедрили AI-ассистентов для профессиональных задач, получают прирост продуктивности на 25–40%. В условиях дефицита квалифицированных специалистов в Казахстане это критически важно: вы делаете больше теми же руками. **Переосмысление ценности.** В экономике сервисов и знаний ценность создаётся не временем, потраченным на задачу, а качеством результата. AI-инструменты меняют уравнение: задача, требовавшая трёх часов ручной работы, теперь занимает 15 минут + 30 минут проверки. Это позволяет перейти на pricing by value, а не by hour. **Роль данных.** Каждый из шести сдвигов объединяет одно: [данные становятся](/blog/gryaznye-dannye-grafovye-bazy-entity-resolution) стратегическим активом. Компании, которые накапливают, структурируют и анализируют свои операционные данные, будут принимать лучшие решения, быстрее обучать своих AI-агентов и создавать продукты с сетевым эффектом. Если ваша компания ещё не выстроила систему работы с данными, 2026 год — последний момент, чтобы начать без критического отставания. [Команда Shipmint](/services/agentic-workflows) помогает бизнесу в Казахстане структурировать данные и внедрять AI-инструменты для роста. ### Как Казахстан позиционируется в контексте глобальных сдвигов? Казахстан имеет структурное преимущество перед многими рынками СНГ: развитая регуляторная среда AIFC, государственная концепция AI до 2029 года и растущая экосистема стартапов вокруг Astana Hub. При этом уровень конкуренции в большинстве ниш существенно ниже, чем в России или Турции. Компания, применившая хотя бы два из шести сдвигов к своей стратегии прямо сейчас, получает advantage first-mover, который сложно ликвидировать даже при больших бюджетах конкурентов позже. Шесть парадигмальных сдвигов — это не просто наблюдения. Это сигналы для стратегического планирования. Каждый сдвиг создаёт волну изменений, которая сначала трансформирует крупные компании, затем доходит до среднего и [малого бизнеса](/blog/ot-haosa-k-sisteme-ai-avtomatizaciya-mikrobiznes-kazahstan). [Казахстанские компании](/blog/ot-ubytkov-k-pribyli-ii-resheniya-kazahstan), которые заметили эти волны заранее и начали адаптацию, будут на гребне, а не захлёстнуты ими. [Обсудите адаптацию с командой Shipmint](/contact). ## Читайте также - [Революция Искусственного Интеллекта: От Экспериментов к Массовому Внедрению](/blog/2025-god-transformacii-tekhnologii-biznes-geopolitiki) - [Что такое Agentic AI: Перепрограммирование корпоративной автоматизации](/blog/agentic-ai-sistemy-2025-avtonomnye-agenty-enterprise) - [Масштаб $100 млрд инвестиции Nvidia в OpenAI](/blog/astana-hub-ai-infrastructure-global-potential-2025) --- ## Related - [Blog](https://shipmint.kz/blog) - [Contact](https://shipmint.kz/contact)