Anthropic создала тестовую торговую площадку, на которой агенты ИИ выступали как представители покупателей и продавцов и пытались заключить максимально выгодные сделки. В компании решили проверить, насколько близко ИИ-технологии подошли к идее цифровых рынков, где нейросети ведут торговлю вместо людей, учитывая их предпочтения.
Для эксперимента работникам офиса Anthropic в Сан-Франциско на неделю запустили онлайн-площадку объявлений наподобие Craigslist. Участники разместили на ней объявления о продаже самых разных вещей, от сноуборда до пакета мячиков для пинг-понга, а ИИ-агенты заключали от их имени сделки.
Исследователь Джанкарло Лелли получил награду в один биткоин за взлом 15-битного ключа на основе эллиптической криптографии (ECC) при помощи облачного квантового компьютера. Награду объявил стартап в области постквантовой безопасности Project Eleven.
Несколько месяцев назад квантовые атаки на ECC перешли из теории в практику. Первым такую атаку продемонстрировал Стив Типпеконник в сентябре 2025 года, взломав 6-битный ключ. Результат Лелли — демонстрация крупнейшей на сегодня атаки подобного типа.
Привет, Хабр! Пока мир обсуждает новые версии нейросетей, в тихой гавани системных утилит произошло не менее важное для многих из нас событие: вышла Ubuntu 26.04, в которой по умолчанию идёт новая версия far2l: 2.8.0.
Если вы следите за моими дайджестами, то знаете: путь этого порта (а теперь уже полноценного форка) Far Manager из мира Windows в нативный Linux был долгим. Начиналось всё с «просто запустить», а сейчас мы пришли к инструменту, который в некоторых аспектах уже опережает своего прародителя.
В этой версии мы закрыли еще несколько древних тикетов и добавили новую функциональность. Под катом — разбор самых вкусных фич релиза.
Стоимость грядущего контроллера Steam Controller от Valve составит $100, пишет Vice со ссылкой на обзор периферийного устройства. Вероятно, автор обзора нарушил эмбарго и опубликовал видео раньше времени. Некоторые пользователи считают, что новый геймпад Valve слишком дорог.
Сегодня посмотрим на вымышленный пример, как не надо делать стор. Любые совпадения - случайность. Все истории выдуманы.
Представьте: есть у нас герой Алекс. Перекидывают его на проект - «поправить пару простых багов, делов на пять минут». Открывает Алекс код, а там… У него сердце замирает. Подумаешь, с кем не бывает. Но внутри начинается дилема: просто пофиксить баги и забыть этот ужас как страшный сон, либо как настоящий богатырь проектов взять и отрефакторить весь этот бардак. Сделать по-человечески, заложить нормальную основу. Да, потом спросят за новые баги - ну и что. Зато внутри тепло разольётся, что не забил на плохой код и навёл порядок.
Операции под землёй, например на станциях метро, в туннелях или шахтах, сопряжены с большим риском и представляют собой сложную задачу для спасательных команд. Это особенно актуально в случаях, когда в результате взрывов или пожара разрушена техническая инфраструктура: отсутствуют сигнал мобильной связи, электричество, освещение, Wi-Fi или GNSS, а дым, обломки и повреждённые проходы ещё больше затрудняют ориентацию.
В рамках проекта NIKE MATE исследовательская группа, состоящая из представителей Технического университета Граца (TU Graz), Университета Леобена, Федерального министерства обороны, компании OHB Austria и инженерного бюро Laabmayr, разработала систему для таких миссий. Она объединяет данные датчиков, полученные от роботов и спасательных команд, с самостоятельно построенной сетью UWB (ультраширокополосной связи). Это позволяет создать динамическую карту окружающей среды, на которой команда может определять своё местоположение и координировать свои действия.
OpenAI GPT-5.5 Pro и GPT-5.5 Thinking набрали по 130 баллов на закрытом IQ-тесте TrackingAI и разделили первое место среди текстовых моделей. На стандартной шкале IQ 130 — это примерно граница верхних 2% населения, именно по этому критерию Mensa приглашает кандидатов с одобренного теста.
24 апреля 2026 года в подкасте “Lenny’s” глава продукта Claude Code и Cowork компании Anthropic Кэт Вурассказала о парадоксальной проблеме: стремительная гонка ИИ-релизов породила у пользователей самый настоящий FOMO – страх упустить что-то важное. И этот страх, по её словам, уже порядком выматывает людей.
Левел дизайн игры Dishonored достойный пример грамотного построения уровней с гибкостью подхода к прохождению, одна ко мне заметился один элемент который как по мне является неполным или даже несколько непродуманным в общем настроении уровня и что именно не так, а так же как ещё более плотно связать мир игры и механику хаоса, попробую изложить как и в прошлой части, но с большим рассмотрением точечных изменений уровней которые сделают их более запоминающимися. Отдельно упомяну переосмысление хаоса, которое перескажу для простоты понимания последующих рассуждений:
Тестирую DeepSeek V4 Pro, DeepSeek V4 Flash и другие
На что можно потратить субботу
24 апреля DeepSeek выпустил новые модели: DeepSeek V4 Pro и DeepSeek V4 Flash. А вчера, 25 апреля, так уж получилось, я тестировал для своего проекта текстовые модели. Полюбившийся мне DeepSeek 3.2 сбоил, и я решил выбрать ему замену. Так случайно я грохнул почти весь выходной день на тест.
Все API-запросы отправлялись через OpenRouter. Prompt был единым для всех запросов. Единственное, что менялось, это сами модели. Результаты вы можете увидеть в таблице выше.
В промпте LLM ставилась цель выдать свое экспертное мнение по шахматной партии. Задача реальная и для моего проекта нужная. То есть, это не тест ради теста. Ответ ожидался в виде json-файла. Обычный бейзлайн, ничего особенного. Казалось бы, несложная задачка, но мозг DeepSeek 3.2 явно взорвался, потому что раз за разом он присылал сломанный json. Конечно, можно было провалидировать и отправить на исправление, но и с этим у него были сложности. В таблице написано, что было 2 вызова, но правильнее было написать 2 часа мучений с 3.2 версией с разными провайдерами.
Таблица содержит только технические показатели. А что же с качеством? Насколько удовлетворен запрос бизнес-задачи? И вот здесь собака и порылась.
Знаете, я не ожидал Отлично. Это не могло быть в принципе. Очень хотелось верить в Хорошо, как возможное чудо от какой-нибудь GPT-5.5. Но максимум был получен Удовлетворительно и только у двух других моделей. А НЕУД у всех остальных.
Лучшие модели Anthropic и OpenAI нагородили разной чуши, но весьма складно и много. За что получили бан - НЕУД. Claude Opus 4.7 отстой. GPT-5.5 не завелась, а ее замена и моя надежда GPT-5.4 оказалась лучше антропиковского Опуса, но стреляла много и по большей части в молоко. И, заметьте, это самые дорогие модели!!!
Удовлетворительно себя показали DeepSeek V4 Pro и Gemini 3 Flash Preview от Google. Первая слишком медленная, больше 800 секунд. Поэтому победителем была выбрана более дешевая и самая быстрая гугловская модель. Согласитесь, 63 секунды удовлетворительного качества меньше, чем за 4 рубля, это же считай отлично.
Gemini 3 Flash Preview - фаворит нашего субботнего забега. Сказать, что я был сильно удивлен, ничего не сказать.
Безусловно, у каждого из нас свои задачи, сферы применения и требования. Они разные, а поэтому и модели могут вести себя по-разному. Где-то лучше, где-то хуже. Полученные мной результаты выше справедливы для моей узкой задачи, но для ваших задач эти же модели могут показать себя совершенно иначе.
Я позволил себе быть весьма эмоциональным. Воскресенье, имеют право. Я там прошелся по 5.5 и 4.7. Но реальность такова, что я программирую на Codex и Claude Code с помощью моделей GPT-5.5 и Opus-4.7 и очень ими доволен. Они отлично работают для меня в программировании, но не сработали в моей прикладной задаче. C'est la vie, такова жизнь.
Ваш Эдуард Ланчев, тестировщик-эспериментатор выходного дня.
Войдя в мою лабораторию, первое, на что вы обратите внимание — это точки. Стены обставлены прозрачными боксами, каждый из которых подписан, датирован и маркирован точками. Некоторые боксы этими точками буквально усеяны, на других же их, наоборот, очень мало. Вы ещё не в курсе, что все эти метки означают, но паттерн налицо. Это моя система организации порядка. Она обошлась мне в три доллара, не требует никакого ПО и работает уже четыре года.
Spotify переносит свои рекомендации по музыке и подкастам непосредственно в чат-бот Claude от Anthropic. Теперь пользователи могут подключить свою учётную запись к ИИ для получения персонализированных рекомендаций, основанных на вкусах и истории прослушивания.
Эта история началась с новогоднего подарка. Младшей дочери подарили обучающую игрушку - небольшой граммофон с маленькими картонными пластинками. Ставишь пластинку на проигрыватель, поворачиваешь маленький пластиковый тонарм и игрушка играет песенку или рассказывает сказку на английском языке. О том как заставить её заговорить на других языках и о других её недокументированных возможностях - эта статья. Жесткого реверсинга и хардкорного моддинга не будет, а будет история проб и ошибок со счастливым концом.
В данной статье я расскажу о том, как работать с Qemu. Научимся запускать операционные системы без необходимости делать загрузочные флешки. Разберёмся на базовом уровне с настройками и опциями данного эмулятора.
Исследователь безопасности из китайского университета Цинхуа на конференции Black Hat Asia показал IDScope — систему взлома арендных IoT‑устройств, таких как зарядные станции для электромобилей. По его словам, такие устройства уязвимы на уровне архитектуры.
Токийский окружной суд обязал американскую компанию коммуникационных технологий Zoom Video Communications выплатить примерно $1,1 млн японскому производителю звукового оборудования Zoom Corporation за нарушение прав на товарный знак Zoom.
DeepSeek V4 Pro — это 1,6 триллиона параметров, mixture of experts (MoE), 49 млрд активных параметров и контекст в 1 миллион токенов. V4 Flash — рабочая лошадка: 284 млрд параметров суммарно, 13 млрд активных. Обе модели обучены примерно на 33 трлн токенов. На агентских бенчмарках кода, MMLU Pro, GPQA Diamond, SWE-bench Verified — V4 рядом с Opus 4.7 и GPT-5.5. Немного отстаёт, но совсем немного.
Вот в чём дело.
Большинству задач не нужен абсолютный frontier. Компании не решают сложнейшие научные задачи — они ведут бизнес. Представьте: вы CEO, смотрите на GPT-5.5 по $30 за миллион выходных токенов, на Opus 4.7 по похожей цене — и тут DeepSeek в разы дешевле, open source, его можно дообучать, хостить где угодно, контролировать точечно. Математика очевидна.
Накануне майских праздников мысли многих уже устремлены к мангалу и даче. Но у DDoS-атак нет выходных. И пока мы переключаемся на отдых, ландшафт угроз продолжает стремительно трансформироваться.
В конце 2025 года мы наблюдали значительный рост числа «атак с усилением» и «атак с фрагментацией». Казалось, что атакующие исчерпали ресурсы ботнетов и решили компенсировать это, задействуя незаражённые устройства.
Но уже в первом квартале 2026 года картина изменилась. Что произошло и как это меняет подходы к защите — разбираемся под катом.