Статья
Дайджест: ИИ-агенты, фальсифицируемость науки и миграция DWH
Обзор ключевых тем: разбор критики российских ИИ-моделей, практическое руководство по созданию переводчика для редких языков, философский взгляд на фальсифицируемость в науке и опыт миграции с Vertica на Lakehouse в Avito.
TL;DR
- Эксперт критикует текущее состояние российских LLM, но видит путь к их развитию через открытые модели и специализацию.
- Разработчик делится практическим опытом создания переводчика для низкоресурсного кабардинского языка, сталкиваясь с проблемой нехватки данных.
- В переводе с AMA Шона Кэрролла обсуждается, почему критика теории струн за «нефальсифицируемость» может быть слишком упрощённой.
- Техлид из Avito описывает процесс и причины миграции аналитической платформы с Vertica на архитектуру Lakehouse.
- Автор размышляет о том, что привычные управленческие паттерны могут быть неэффективны при работе с AI-агентами.
Критика и путь для российских ИИ-моделей
Что случилось: В статье представлен критический, но конструктивный взгляд на текущее состояние крупных языковых моделей (LLM), разрабатываемых в России. Автор признаёт их отставание в таких областях, как кодинг и математика, но предлагает стратегию развития.
Почему важно: В условиях технологических ограничений и санкций важно определить реалистичные и эффективные пути развития локальных AI-решений, а не просто констатировать отставание.
Кому важно: Руководителям и разработчикам в сфере AI, инвесторам в технологические стартапы, государственным структурам, формирующим tech-политику.
Что делать: Сфокусироваться на создании и развитии открытых моделей среднего размера, которые можно дообучать для конкретных узких задач (специализация), а не гнаться за гигантскими универсальными моделями.
Источник: Российский ИИ: критика, которая нужна сейчас, и путь, который работает
Практика: машинный перевод для низкоресурсных языков
Что случилось: Разработчик на личном опыте описывает процесс создания системы машинного перевода для кабардинского языка, относящегося к низкоресурсным (с малым объёмом доступных текстовых данных).
Почему важно: Сохранение и цифровизация языкового разнообразия — актуальная задача. Практический опыт преодоления проблем с данными ценен для сообщества.
Кому важно: Лингвистам, энтузиастам цифровой гуманитаристики, разработчикам NLP-решений, работающим с редкими языками или узкими доменами.
Что делать: Изучать описанные методы сбора и обработки данных, а также подходы к обучению моделей в условиях дефицита параллельных корпусов (пар «исходный текст — перевод»).
Источник: Как создать переводчик для низкоресурсного языка: практическое руководство
Философия науки: сложность фальсифицируемости
Что случилось: В переводе выдержки из сессии вопросов и ответов с физиком Шоном Кэрроллом обсуждается распространённая критика теории струн, основанная на её предполагаемой нефальсифицируемости.
Почему важно: Вопрос фальсифицируемости (проверяемости) является краеугольным камнем в философии науки. Обсуждение помогает понять, что применение этого критерия на практике часто сложнее, чем в теории.
Кому важно: Научным работникам, популяризаторам науки, философам, всем, кто интересуется методологией научного познания и границами современных физических теорий.
Что делать: Критически оценивать упрощённые утверждения о «ненаучности» тех или иных теорий, углубляться в контекст и современные дискуссии в философии науки.
Источник: [Перевод] О фальсифицируемости и о том, почему с ней не всё так просто
Миграция DWH: от Vertica к Lakehouse в Avito
Что случилось: Технический лидер аналитической платформы Avito описывает причины и процесс миграции хранилища данных (Data Warehouse) с коммерческой СУБД Vertica на архитектуру Lakehouse (озеро данных + хранилище).
Почему важно: Опыт крупной IT-компании по переходу на современную, более гибкую и, как правило, более экономичную архитектуру данных крайне полезен для рынка.
Кому важно: Data-инженерам, архитекторам данных, CTO компаний, где растут объёмы и разнообразие данных, а также затраты на лицензионное ПО.
Что делать: Изучать кейс для понимания потенциальных выгод (масштабируемость, стоимость, гибкость) и сложностей миграции подобного масштаба.
Источник: Есть ли жизнь после Vertica или миграция DWH в Lakehouse
Управление AI-агентами: новые паттерны
Что случилось: Автор ставит под сомнение прямую аналогию между AI-агентом и работником организации, предлагая обсудить, насколько управленческие паттерны из реального мира применимы к взаимодействию с автономными ИИ-системами.
Почему важно: По мере усложнения AI-агентов встаёт вопрос об эффективных моделях их интеграции в бизнес-процессы и «управления» ими, что требует новых подходов.
Кому важно: Продукт-менеджерам, внедряющим AI-решения, руководителям IT-подразделений, разработчикам multi-agent систем.
Что делать: Не переносить слепо HR- и управленческие практики на AI-агентов, а проектировать интерфейсы и протоколы взаимодействия, учитывая их специфическую природу.
Источник: Варианты взаимодействия AI-агентов
Риски и неопределенности
- Предложенный путь развития российских LLM через специализацию может не обеспечить конкурентоспособности на глобальном уровне в создании фундаментальных моделей.
- Разработка инструментов для низкоресурсных языков часто упирается в проблему финансирования и долгосрочной поддержки проектов.
- Миграция сложных DWH-систем всегда сопряжена с высокими операционными рисками и длительным периодом стабилизации.
- Нет единого понимания, какие именно управленческие метафоры и паттерны окажутся продуктивными для AI-агентов.
Сегодняшний дайджест отражает переход от общих разговоров об ИИ к практическим вопросам его разработки, интеграции и даже философского осмысления его границ. Фокус смещается на реализацию, архитектуру и прикладную этику.
Источники
- CIMCO Edit для Windows 7
Windows 10 нинужон! Запускаем 3D симуляцию самого популярного в мире редактора УП для станков с ЧПУ CIMCO Edit 2025 (2025.01.25) в операционной системе Microsoft Windows 7. И ещё переводим на русский язык саму программу. Читать далее всё эт
- Как создать переводчик для низкоресурсного языка: практическое руководство
Привет, Хабр! В продолжение моей предыдущей статьи о локальном переводчике на кабардинском языке хочу поделиться практическим опытом обучения моделей машинного перевода для низкоресурсных языков. Расскажу о том, с какими проблемами я столкн
- IT-2025: Реквием по здравому смыслу
Мы входили в эту реку дважды, трижды, бесконечное количество раз. Мы ждали 2025 год как рубеж, за которым наступит технологическая сингулярность, где рутина будет автоматизирована, а творчество возведено в абсолют. Писатели-фантасты и футур
- Российский ИИ: критика, которая нужна сейчас, и путь, который работает
Сейчас, наверное, только ленивый не ругает наши российские LLM: редкие и слабые релизы, спорная практическая эффективность, особенно в кодинге и математике, ограниченный контекст и забывчивость, плохое следование инструкциям и поверхностные
- Есть ли жизнь после Vertica или миграция DWH в Lakehouse
Всем привет! Меня зовут Дмитрий Рейман, я техлид аналитической платформы Авито. Мы строим систему общего назначения, которая одновременно обслуживает ETL, витрины, BI, ad-hoc аналитику и продуктовые платформы. И в какой-то момент мы столкну
- Как мы случайно сделали стартап, пока учили ИИ работать с реальной инфраструктурой
Когда мы впервые увидели AI-чаты, это выглядело впечатляюще. Они писали код, помогали с документацией, объясняли архитектурные решения. Это было хорошо. Но довольно быстро стало понятно главное: Читать далее
- Варианты взаимодействия AI-агентов
В обсуждении со специалистами часто встречаю фразу от коллег: «Ассоциируйте AI‑агента с работником организации». В этой статье я не предлагаю решения, я скорее предлагаю тему для обсуждения — насколько привычные управленческие паттерны «из
- 12 популярных мифов про геймдев и игровую графику
К сожалению, геймдев сегодня — далеко не самое популярное направление в IT. Возможно дело в том, что это работа не для «чистых» технарей, а скорее для дизайнеров. И подавляющее большинство айтишников не заняты разработкой игр напрямую, а по
- [Перевод] О фальсифицируемости и о том, почему с ней не всё так просто
От переводчика: это перевод-выдержка из одного из ask-me-anything сессий физика-популяризатора Шона Кэрролла. Вопрос: Я хотел бы узнать ваше мнение об одном распространённом критическом замечании в адрес теории струн — а именно о её фальсиф
- Нескучное программирование. Overloads
Года четыре назад, на стыке двух проектов, когда старый уже просто сапортили, а новый только находился в стадии препродакшена и питчингов разной степени завершенности (планирование и попыток продать концепт и идеи незаинтересованным инвесто