MedGemma: разбираем медицинский AI от Google

25 февраля — финал The MedGemma Impact Challenge на Kaggle. Я уже несколько недель копаюсь в этой медицинской модели от Google, пытаясь выжать из неё что-то крутое для конкурса. Пока идеальное решение где-то между "гениально" и "зачем я это делаю в 3 ночи", решил поделиться тем, как вообще эта штука работает и что с ней можно делать.

Спойлер: она умеет не только отвечать "идите к врачу" на любой симптом 🏥

Есть такая штука — MedGemma. Google взяли свою Gemma, скормили ей всю медицинскую литературу (наверное, включая инструкции к валидолу), и получилась модель, которая:

Читайте также

Работает на обычной RTX 4060 (привет, майнерам прошлых лет)

И вот на Kaggle запустили челлендж с призовым фондом, а я подумал: "Сколько ещё можно писать скрипты для парсинга? Пора спасать человечество с помощью AI!"

Три недели спустя я уже знаю о тензорах в bfloat16 больше, чем о своём давлении. Но кое-что интересное удалось выяснить.

MedGemma — это не просто "ChatGPT для медицины". Это специально обученная модель, которая:

Реально знает медицину — её учили не на Stack Overflow, а на PubMed и медицинских учебниках

Мультимодальная — понимает и текст, и картинки (представьте, может анализировать рентген!)

Локальная — работает у вас на компе, никуда не сливая ваши медицинские данные

Весит разумно — 4B параметров, а не 175B как некоторые

Важный дисклеймер: это не медицинский прибор, не лицензированный софт для диагностики, и вообще всегда консультируйтесь с врачом. Но для исследований и прототипов — самое то.

Первым делом убеждаемся, что видеокарта не ушла на майнинг:

8.6 гигов — в самый раз. На 4 гига уже будет грустно, на 16+ — вообще красота.

Если у вас загрузка падает с CUDA out of memory — поздравляю, вы в клубе "пора обновляться". Можно попробовать квантизацию до int8, но это отдельная история.

Чтобы каждый раз не писать километры кода, делаем helper:

Ок, модель не галлюцинирует, что гипертензия — это новый вид йоги. Годится.

Вот это поворот! Модель не просто перевела, а дала структурированный ответ с маркированным списком. Кто-то в Google явно любит аккуратность.

✅ Показания: диабет 2 типа, преддиабет, СПКЯ, ожирение

✅ Механизм: улучшение чувствительности к инсулину, снижение выработки глюкозы печенью

✅ Побочки: ЖКТ-расстройства, дефицит B12, лактоацидоз (редко)

Это уровень ответа из хорошего медицинского справочника. Для модели на 4B параметров — впечатляет.

Проверяем, понимает ли модель взаимодействие лекарств:

Модель не просто сказала "нельзя", а объяснила почему и когда всё-таки можно. Это важно.

Тут я проверяю, может ли модель интерпретировать результаты. Даём ей цифры из анализа крови:

✅ Локальность — данные не уходят в облако ✅ Скорость — ответы генерируются за секунды ✅ Русский язык — работает без костылей ✅ Структурированность — ответы как из учебника ✅ Честность — признаёт ограничения и шлёт к врачу

❌ Не может в контекст — не знает историю болезни ❌ Галлюцинации — редко, но бывают ❌ Нет персонализации — одинаково для всех ❌ Юридически непригодна — не медицинский прибор ❌ Требует GPU — на CPU будет медленно

Бот, который задаёт правильные вопросы и определяет срочность обращения. Не ставит диагноз, а помогает понять: "это вызов скорой" или "можно записаться к терапевту на неделе".

Загружаешь список своих препаратов, получаешь предупреждения о возможных конфликтах. Особенно актуально для пожилых людей с кучей таблеток.

Врач написал в выписке непонятные термины? Модель переводит на человеческий язык без потери смысла.

Получил результаты — вставил в приложение, получил объяснение что к чему. С рекомендацией "показать врачу", естественно.

bfloat16 (brain float) — формат от Google с такой же точностью по экспоненте, как у float32, но с меньшей мантиссой. Для языковых моделей это идеально:

Если 8 GB VRAM не хватает, можно загрузить модель в int8:

Качество почти не страдает, зато модель влезет в 4-6 GB.

torch.inference_mode() быстрее, чем torch.no_grad():

MedGemma: разбираем медицинский AI от Google

Читайте также

Похожие новости

Похожие новости

Без Starlink Россия блуждает – "Рубикон", элитное подразделение дронов Путина, перегнул палку

Россия: Продажи БАДов от дефицита железа выросли на 54% на фоне бума чекапов

Синоптик предупредил о сильнейшей гололедице в начале недели в Москве

Бразильский учитель, защитивший учеников во время нападения в Канаде, преподает с помощью изобретений и когда-то проехал на велосипеде от Сан-Паулу до Аляски

搜索

最新消息

无星链俄军迷失方向普京无人机精英“卢比孔”已越界

俄罗斯铁补充剂销量激增54%：健康意识提升还是激进营销？

气象预报员警告莫斯科本周初将出现严重结冰天气

视频：美海军船只在南美附近发生碰撞瞬间

巴西保姆在美国双重谋杀案中被判处10年监禁

特朗普首次表示有意访问委内瑞拉，但未定具体日期

特朗普政府起诉哈佛，要求提供关于种族录取的文件

埃普斯坦前巴西管家在巴黎举报“年轻苗条女性”来访，报纸称

特朗普在核紧张局势下向伊朗派遣世界最大航母“福特”号

加拿大袭击中保护学生的巴西教师，以奇思妙想教学，曾骑行穿越从圣保罗到阿拉斯加

美国政府起诉哈佛大学，要求提供学生录取数据

特朗普敦促泽连斯基“行动”以达成对俄协议，欧洲防务呼声渐起

阅读最多