Авторы
Горбунова А. В.
студентка, 4 курс, биотехнологический факультет1
Шмакова Я. В.
студентка, 5 курс, фармацевтический факультет2
Калугина О. Ф.
студентка, 4 курс, лечебный факультет3
Прохоров М. В.
студент, 4 курс, фармацевтический факультет4
Бобров А. И.
студент, 6 курс, Институт клинической медицины5
Кошечкин К. А.
д.фарм.н., профессор, кафедра информационных и интернет-технологий5
1ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова», Москва, Российская Федерация
2ФГБОУ ВО «Санкт-Петербургский государственный химико-фармацевтический университет» Минздрава России, Санкт-Петербург, Российская Федерация
3ФГБОУ ВО «Ярославский государственный медицинский университет», г. Ярославль, Российская Федерация
4ФГБОУ ВО «Воронежский государственный университет», г. Воронеж, Российская Федерация
5ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет), Москва, Российская Федерация
Автор для корреспонденции
Горбунова Александра Владимировна; e-mail: gorbunova.av2002@yandex.ru
Финансирование
Исследование не имело спонсорской поддержки.
Конфликт интересов
Авторы заявляют об отсутствии конфликта интересов.
Аннотация
Введение. В статье рассматривается проблема использования лабораторных животных в доклинические исследованиях и, как вариант решения этой проблемы, применение современных технологий, в частности искусственного интеллекта. Цель работы: изучить применение методов компьютерного зрения и больших языковых моделей для проведения доклинических исследований. Обсуждение. В настоящее время в медицине активно ведется работа по замене животных моделей в доклинических исследованиях на более современные решения. В этом процессе важную роль играет использование искусственного интеллекта (ИИ), позволяющего ускорить и улучшить качество экспериментов, и тем самым предотвратить исследования с участием животных, которые могут оказаться неоправданными и, в большинстве случаев, смертельными. Использование ИИ в доклинических исследованиях позволяет проводить более точные эксперименты, уменьшить вероятность неудачных исследований и повысить уровень достоверности результатов. Также, применение ИИ позволяет сократить количество животных, которые используются в исследованиях. Уменьшение числа жертв экспериментов является одним из основных аспектов биоэтики. Путем замещения животных на компьютерные модели и виртуальные системы на базе ИИ можно уменьшить их страдания и улучшить защиту от негативных эффектов экспериментов. Выводы. Таким образом, использование искусственного интеллекта в доклинических исследованиях вместо животных – это верный путь к развитию более этичных, точных и эффективных методов научных исследований.
Ключевые слова
искусственный интеллект, доклинические исследования, машинное обучение
Для цитирования
Горбунова А. В., Шмакова Я. В., Калугина О. Ф., Прохоров М. В., Бобров А. И., Кошечкин К. А. Использование методов компьютерного зрения и больших языковых моделей для проведения доклинических исследований. Медицина 2024; 12(3): 55-68
DOI
Введение
В доклинической практике уже долгое время широко применяются животные модели. Фармацевтическая разработка предполагает использование лабораторных животных для решения множества задач в области экспериментальной фармакологии, изучения фармакокинетических параметров, токсичности и безопасности лекарственных средств прежде, чем перейти к первым фазам клинических исследований. По оценкам Управления по санитарному надзору за качеством пищевых продуктов и медикаментов США (The U.S. Food and Drug Administration, FDA) 92% успешных доклинических исследований заканчиваются неудачами на стадии клинических испытаний [1].
При обучении AI можно использовать датасеты, содержащие данные о биохимии, анатомии, физиологии и патологии, что позволяет разрабатывать вычислительные модели, воспроизводящие поведение органов, тканей и биологических систем. Эти виртуальные модели обеспечивают более точное представление реакций человека на вещества, позволяя лучше прогнозировать токсичность, эффективность и другие важные конечные точки [2]. AI-модели подходят для прогнозирования на основе закономерностей, выявленных в больших и разнообразных наборах данных, с учетом множества факторов. В контексте физиологических процессов AI может анализировать обширные данные и выявлять корреляции между генетикой, действием окружающей среды и конкретными целевыми взаимодействиями. Кроме того, алгоритмы способны анализировать и интерпретировать экспериментальные данные, направляя исследователей к потенциально более успешным экспериментам. Обрабатывая большие объемы данных, AI может выявлять закономерности, корреляции и тенденции, которые могут быть не сразу очевидны для исследователей-людей.
Компьютерное зрение (или машинное зрение) – это область научных исследований, включающих в себя автоматическую фиксацию и обработку полученных в ходе работы изображений посредством компьютерных программ [3]. Такие методики могут применяться для обработки результатов компьютерной томографии, микроскопии, визуализации проточной цитометрии, анализа разнообразных снимков, полученных в ходе исследований на животных.
Большие языковые модели могут использоваться для обработки больших массивов первичных данных, полученных в ходе экспериментов. В настоящее время языковые модели преимущественно нашли применение в клинических исследованиях, но теоретически мы можем предложить варианты их использования и в доклинических исследованиях.
Цель и задачи работы
Цель работы – изучить применение методов компьютерного зрения и больших языковых моделей для проведения доклинических исследований.
Задачи – изучить и провести анализ литературных данных на тему применения компьютерного зрения и больших языковых моделей в доклинических исследованиях.
Использование компьютерного зрения в доклинических исследованиях
В доклинических исследованиях машинное зрение может быть использовано в различных случаях. Так, существует множество областей биомедицинских исследований, требующих высокочувствительного выявления и подсчета редких популяций циркулирующих клеток в крови мелких животных.
Одним из достаточно часто применяющихся методов является проточная цитометрия (ПЦ). Особенно интересным с точки зрения применения методов компьютерного зрения является визуализирующая ПЦ, позволяющая получить изображения каждой исследуемой клетки. Так, в одном из исследований предлагается использование сверточных нейронных сетей для идентификации агрегатов одноклеточных тромбоцитов в цельной крови. Данная манипуляция применяется для оценки свертываемости крови и может быть использована в доклинических исследованиях антикоагулянтных препаратов [4].
Проведение исследований методом проточной цитометрии подразумевает забор образцов периферической крови. К сожалению, инвазивность процедуры в данном случае может негативно сказаться на результатах исследования. Также необходимо учитывать, что объем крови, которую можно забрать у мелких экспериментальных животных (например, крыс или мышей), достаточно мал, и велика вероятность, что тот тип клеток, который исследователи надеются обнаружить, не попадет в пробу. Поэтому в настоящий момент особую популярность набирают методы «проточной цитометрии in vivo» (IVFC), позволяющие непрерывно и неинвазивно обнаруживать циркулирующие клетки за счет оптических приборов.
Для улучшения качества обработки полученных данных в некоторых исследованиях предлагается использование методов компьютерного зрения. В одном из таких исследований авторами было предложена ступенчатая система отслеживания меченых клеток. На первых стадиях происходит отслеживание клеток-кандидатов. Для снижения влияния шумов предлагается производить «вычитание бэкграунда» за счет вычисления средней интенсивности всех пикселей на поле и последующего вычитания данного значения из значения интенсивности для каждого пикселя. При этом каких-либо ограничений по размерам и форме клеток не применяется, а пороговое значение устанавливается для каждого кадра индивидуально на основании процентиля интенсивности всех пикселей.
На следующих этапах происходит отслеживание траектории для каждого предполагаемого кандидата, и при совпадении ее с сосудистым рисунком кандидат переходит в разряд реальной клетки. Предложенный алгоритм помогает отделить излучающие сигнал клетки от фонового шума, а также облегчить процесс их обнаружения и подсчета [5].
В настоящее время очень активное развитие наблюдается в области применения нейросетевых моделей для анализа изображений, получаемых в ходе компьютерной томографии. В исследованиях используются методы глубокого обучения, позволяющие решать проблему различного уровня интенсивности изображений в зависимости от типа заболевания, а также проблем наличия шумов на снимках из-за высокой двигательной активности мелких животных во время исследования.
Немалая часть работ связана с улучшением качества обработки результатов компьютерной томографии (КТ) легких [6,7]. Так, для анализа плотности тканей у мышей с фиброзом легких авторами предлагается использование моделей сверточных нейронных сетей с архитектурой на основе U-Net. Сам модуль сегментации представляет из себя каскад из двух моделей нейросетей: модель с низким разрешением, обученная на выборках изображений с низким разрешением, и 2,5D модель, но уже с высоким разрешением. В состав последней входят три 2D-модели. Входящие изображения сегментируются в трех различных плоскостях (аксиальная, корональная и сагиттальная), а результаты обработки затем объединяются путем голосования [6].
Использование моделей на основе U-Net архитектуры в принципе достаточно распространено среди КТ исследований. Они применяются для анализа снимков различных органов и тканей животных и позволяют с достаточно хорошим успехом автоматизировать процессы обработки большого количества данных [8,9].
Важно отметить, что применение нейросетей в данной области не сводится только к простому облегчению процессов обработки данных. Некоторые исследования направлены на модификацию уже существующих протоколов исследований с целью снижения воздействия тех или иных факторов на экспериментальных животных. Так, предполагается, что применение методов анализа на основе сверточных нейросетей может помочь снизить дозовую нагрузку на животных за счет повышения чувствительности методов обработки результатов [10].
Обработка гистологических препаратов методами компьютерного зрения также является достаточно перспективным направлением. Данные модели могут быть использованы для анализа цифровых изображений опухолей, определения площади и характера поражения. В одной из недавних работ предлагалось использование моделей на базе inception-v3 архитектуры для классификации эпителиальных опухолей (аденокарциномы и аденомиомы) желудка и толстой кишки. Inception-v3 достаточно хорошо показывает себя в тестах на классификацию, и данная работа не стала исключением. Точность предсказания модели была выше, чем точность определения у врачей-специалистов (95,6% и 85,89% ± 1,401% соответственно). К тому же, скорость работы модели также была выше, чем скорость постановки диагноза практикующими врачами [11].
В другой работе исследователями предлагается использование методов глубокого обучения для предсказания микросателлитного статуса больного на основании гистологических препаратов. В ходе разработки подхода было проанализировано несколько основных моделей классификации. Среди всех наименьшее количество параметров имела resnet18, что делает ее потенциально более портативной и менее подверженной переобучению. Модель показала высокую точность предсказания (>95%), а малое количество задаваемых параметров делает ее удобной в использовании [12].
Также новая система, которая использует ИИ для отслеживания телодвижений животного, может быть использована на лабораторных животных и помочь в исследованиях новых лекарств. Технология точно определяет расположение каждой части тела – ног, головы, носа и так далее – в миллионах кадрах видео. Сначала человек-экспериментатор записывает видео движущегося животного. Затем экспериментатор дает указание программному обеспечению системы идентифицировать небольшое количество изображений, на которых можно определить положение частей тела. Затем система использует этот набор данных для обучения нейронной сети расчету местоположения точек в последующих кадрах [13].
В одном из исследований предлагалось использование компьютерного зрения для наблюдения за пролиферацией раковых клеток. Ученые рассматривали рыбку данио как модельный организм для изучения рака человека. Прозрачность эмбрионов рыбок данио и развитие линии рыбок данио «каспер» с дефицитом пигмента дают возможность непосредственно наблюдать за формированием и прогрессированием рака у животного. Исследователи предложили новый инструмент, а именно ZFTool, для автоматической количественной оценки эволюции раковых клеток. Инструмент способен устанавливать базовый порог, который исключает автофлуоресценцию эмбриона, автоматически измерять площадь и интенсивность клеток, меченных зеленым флуоресцентным белком, а также определять индекс пролиферации. В результате индекс пролиферации, рассчитанный на различных мишенях, продемонстрировал эффективность ZFTool в обеспечении хорошей автоматической количественной оценки эволюции раковой массы у рыбок данио, устраняя влияние ее автофлуоресценции [14,15].
Компьютерное зрение может применяться в сочетании с покадровой микроскопией для получения кинетических показателей уничтожения опухолевых клеток. Анализ покадровой микроскопии позволяет отслеживать рост опухолевых клеток с течением времени, а также количественно определять кинетические показатели потенциальных терапевтических средств. Отмечается возможность ко-локализации органоидов и иммунных клеток с течением времени, что позволяет оценить дозозависимую эффективность кандидатов в терапевтические средства [16].
В настоящее время активно используется применение методов компьютерного зрения для определения мышечной массы модельных организмов. Благодаря этой модели имеется возможность избегать инвазивных методов диагностики, а также получать достоверные данные при минимальной погрешности. Важность массы тела в организме неоспорима, так как запасы питательных веществ необходимы для работы сердечно-сосудистой и нервной систем. Многие исследования проводятся на животных, в том числе и на мышах, но проблема заключается в том, что мыши очень гибкие и маленькие, что затрудняет точное измерение веса. Поэтому вопрос о том, насколько точно можно заменить ручное измерение веса животных автоматическим методом, особенно у различных генетических линий мышей, остается открытым. В существующих исследованиях можно отметить, что определение массы мыши на основе компьютерного зрения является довольно точным и может быть доработано для получения лучших результатов. Методы компьютерного зрения могут быть распространены на измерения и других организмов, например, крыс и даже на приматов, где оценка массы вручную – достаточно сложный процесс [17].
Большие языковые модели в доклинических исследованиях
Применение больших языковых моделей (LLM) в доклинических исследованиях с соблюдением требований GLP представляет собой перспективную и инновационную область, которая может значительно улучшить эффективность и качество проводимых исследований. Ниже представлены некоторые возможности LLM в доклинических исследованиях.
Анализ и обработка данных
Большие языковые модели могут быть использованы для анализа разнообразных данных, полученных в рамках доклинических исследований. Это включает в себя анализ результатов экспериментов, обработку текстовых данных из научных публикаций, а также автоматизированную обработку отчетности в соответствии с требованиями GLP.
Научные исследования проходят быстрыми темпами и постоянно развиваются, что приводит к росту числа публикаций различного качества. Надлежащее использование этих знаний является серьезной проблемой для исследователей. LLM могли бы помочь обобщить научные концепции и существующие данные. LLM в настоящее время не всегда предоставляют соответствующие подробные резюме или критические оценки актуальных, высококачественных, прошедших экспертную оценку фактических данных. Поскольку LLM в настоящее время не обновляются динамически, их знания статичны, что препятствует доступу к последним достижениям науки, если они используются в качестве основного источника. Однако, если бы можно было внедрять обновления в режиме реального времени и повышать достоверность фактов, ценность LLM как источника актуальных фактических данных существенно возросла бы. Например, LLM можно использовать для эффективного извлечения интересующих данных из огромных неструктурированных текстовых файлов или изображений, что является утомительной задачей, которая может привести к ошибкам, если ее выполнять вручную. Качественные резюме с поддержкой LLM могли бы помочь ориентироваться в проблемах быстро меняющихся научных данных, и, выявляя возможные связи между литературой, LLM могли бы помочь обнаружить новые исследовательские траектории.
Ниже мы приведем примеры возможностей использования LLM для обобщения отчетов в клинической сфере, так как LLM до настоящего момента в этих целях в доклинических исследованиях не использовались.
Так, например, была произведена оценка обобщений 137 клинических отчетов и 100 отчетов о случаях заболевания аневризмой аорты, опубликованных в PubMed. Модели были 1) сопоставлены со сводкой, сгенерированной экспертами, с использованием записей о изображениях случаев аневризм аорты, собранных в их институте, и 2) сравнены с использованием общедоступных отчетов о случаях на PubMed. Для обобщения клинических отчетов использовались пять моделей искусственного интеллекта, а шестая модель, онлайн-GPT3davinci NLP large language model (LLM), была добавлена для обобщения отчетов о случаях заболевания в PubMed. Качество обобщения оценили путем сравнения с резюме экспертов, используя количественные показатели и обзоры качества, сделанные экспертами. Экспертная оценка проводилась на основе оценки удобочитаемости, точности информации, полноты и избыточности. В результате GPT3davinci продемонстрировал превосходную производительность при обобщении отчетов о случаях, набрав наивысшие баллы во всех категориях [18].
Другим примером может стать оценка восьми LLM, охватывающих четыре отдельные клинические задачи обобщения: отчеты по рентгенологии, вопросы пациентов, заметки о ходе работы и диалог врача с пациентом. Количественные оценки с помощью синтаксических, семантических и концептуальных метрик НЛП выявляют компромиссы между моделями и методами адаптации. Клиническое исследование, в котором приняли участие 10 врачей, оценило полноту, правильность и сжатость резюме; в большинстве случаев резюме наиболее адаптированных LLM были признаны либо эквивалентными (45%), либо превосходящими (36%) резюме медицинских экспертов [19].
Оптимизация процессов исследований
Использование больших языковых моделей позволяет автоматизировать и ускорить многие процессы, связанные с документированием, анализом и интерпретацией результатов доклинических исследований. Это способствует более быстрой и точной оценке эффективности лекарственных средств и соблюдению требований GLP.
Для наглядности применения возможности LLM для интерпретации результатов исследований можно взять пример использования LLM, ускоряющей составление отчетов о рентгенологических исследованиях за счет обобщения клинических результатов. Так, было доработано двенадцать языковых моделей с открытым исходным кодом для корпуса из 37 370 ретроспективных отчетов о домашних животных. Все модели были обучены с использованием алгоритма принуждения преподавателя, с выводами отчета и информацией о пациенте в качестве входных данных и исходными клиническими наблюдениями в качестве эталона. Среди этих двенадцати моделей была выбрана PEGASUS в качестве лучшего LLM. Чтобы оценить его клиническую полезность, три врача ядерной медицины оценили наблюдения, созданные PEGASUS, и оригинальные клинические наблюдения по 6 параметрам качества (3-балльная шкала) и общей оценки полезности (5-балльная шкала). Каждый врач проанализировал 12 своих собственных отчетов и 12 отчетов других врачей. Когда врачи оценивали наблюдения LLM, составленные в их собственном стиле, 89% были признаны клинически приемлемыми со средним баллом полезности 4,08 / 5. В среднем врачи оценили эти персонализированные впечатления как сопоставимые по общей полезности с впечатлениями, продиктованными другими врачами (4,03, P = 0,41). Таким образом, это исследование продемонстрировало, что наблюдения, генерируемые PEGASUS, были полезны в большинстве случаев, подчеркивая потенциал системы для ускорения составления отчетов [20].
Создание стандартизированных методик и протоколов
Большие языковые модели могут использоваться для разработки стандартизированных методик и протоколов доклинических исследований, включая подготовку подробных инструкций и описаний процессов. Это помогает обеспечить соблюдение требований GLP и повышает надежность результатов.
Улучшение коммуникации и обмена информацией
Использование больших языковых моделей способствует более эффективной коммуникации между участниками исследований, а также улучшает обмен информацией и опытом. Это содействует более точной интерпретации результатов и обеспечивает соблюдение требований GLP в отношении документации и отчетности.
Повышение точности и надежности исследований
Благодаря возможностям анализа больших объемов данных и автоматизации процессов, использование больших языковых моделей способствует повышению точности и надежности проводимых доклинических исследований. Это помогает минимизировать ошибки и соблюдать требования GLP в отношении качества исследований.
Так, было проведено исследование, в котором были преобразованы таблицы в текст для отчетов доклинических исследований с помощью использования новой двухэтапной архитектуры, которая дополнена автокоррекцией, механизмом копирования и синтетическим увеличением данных. Структура их работы состояла из двух компонентов: экстрактора табличных значений, которые должны быть описаны в тексте, и генератора текста, который извлекает данные, полученное на предыдущем этапе, и генерирует фактический текст. Оба компонента представляют собой модели языка SOTA, оснащенные механизмами копирования. В сочетании с этими механизмами копирования их процедура увеличения данных предоставляет обучающие примеры, в которых изменяются только совпадающие значения, а механизм копирования позволяет модели сосредоточиться на них и обеспечить точность их копии. Чтобы помочь модели эффективно адаптироваться к новым источникам данных с минимальными человеческими усилиями, был введен протокол Human-in-the-Loop, посредством которого модель может включать небольшой набор человеческих корректировок в процесс обучения и тем самым создавать «цикл», в котором модель постоянно учится улучшать свои возможности. Исследование показывает, что предлагаемый подход выбирает важные биомедицинские объекты и значения из структурированных данных с повышенной точностью (абсолютное увеличение до 0,13) копирования табличных значений для создания связного и точного текста для отчетов о валидации анализов и отчетов о токсикологии. Более того, также продемонстрирована легкая адаптация предлагаемой системы к новым наборам данных путем тонкой настройки всего с 40% обучающих примеров. [21]
Таким образом, применение больших языковых моделей в доклинических исследованиях с учетом требований GLP представляет собой мощный инструмент для улучшения эффективности, точности и качества научных исследований в области медицины и экологии.
Заключение
В заключение хотелось бы отметить, что применение AI, а именно компьютерного зрения и больших языковых моделей в доклинической практике имеют ряд преимуществ, так как позволяют значительно ускорить процесс исследования, сократить человеческие трудовые ресурсы, снизить вероятность ошибок и опечаток.
Интересно направление совместного использования двух подходов. Компьютерное зрение может применяться для анализа изображений и видеоматериалов, связанных с действием лекарственных средств на организм. Так, можно анализировать изменения в поведении животных после приема лекарственных препаратов, визуализировать эффекты лекарств на клеточном уровне.
Большие языковые модели, в свою очередь, могут быть использованы для анализа текстовых данных, связанных с результатами исследований лекарственных препаратов. Это позволит проводить автоматическую обработку и классификацию научных статей, отчетов и других текстов, чтобы выявить закономерности и новые тенденции в интересующей области.
Объединение компьютерного зрения и больших языковых моделей позволит создать более полную и объективную картину о действии лекарственных препаратов, ускорить анализ данных и выявить потенциальные проблемы или новые перспективы в исследованиях. Это поможет улучшить качество и эффективность доклинических исследований лекарственных средств и повысить вероятность успешного перехода к клиническим испытаниям.
Однако, стоит отметить, что несмотря на перечисленные выше плюсы, на данном этапе развития AI-модели обладают рядом существенных недостатков:
1) Живые организмы представляют собой сложные системы со сложными взаимодействиями между различными органами, тканями, клетками и молекулами. Мы можем предполагать, что часть физиологических процессов на данный момент даже не изучена. Хотя AI может моделировать определенные аспекты биологических систем, полное воспроизведение динамической и многогранной природы биологических организмов представляет собой сложную задачу.
2) Любая система на основе искусственного интеллекта, предназначенная для тестирования лекарственных препаратов, должна пройти строгую проверку, чтобы гарантировать ее надежность и точность в прогнозировании реакции на лекарства и токсичности. Это потребует обширного тестирования и сравнения с реальными данными, чего может быть сложно достичь, учитывая вышеупомянутую сложность биологических систем.
3) В настоящий момент отсутствует какое-либо государственное регулирование в отношении исследований in silico.
Авторский вклад
Горбунова А. В. – работа с источниками литературы, написание текста рукописи, оформление и др.; Шмакова Я. В. – работа с источниками литературы, написание текста рукописи, участие в формулировке выводов; Калугина О. Ф. – работа с источниками литературы, написание текста рукописи; Прохоров М. В. – работа с источниками литературы, написание текста рукописи, Бобров А. И. – работа с источниками литературы, написание текста рукописи, Кошечкин К. А. – концепция работы, утверждение окончательной версии.
Список литературы
1. Animals Used in Research. Animal Legal Defense Fund. [Электронный ресурс]. Режим доступа: https://aldf.org/focus_area/animals-used-in-research/ (дата обращения: 09.04.2024).
2. Lab to algorithm: AI's role in minimising animal testing. Deeper insights [Электронный ресурс]. Режим доступа: https://deeperinsights.com/ai-blog/lab-to-algorithm-ai-role-in-minimising-animal-testing#:~:text=Replacing%20animal%20testing%20with%20AI,and%20prioritise%20substances%20more%20efficiently (дата обращения: 09.04.2024).
3. Горячкин Б.С., Китов М.А. Компьютерное зрение. E-Scio 2020; (9): 317-345.
4. Poschkamp B., Bekeschus S. Convolutional neuronal network for identifying single-cell-platelet–platelet-aggregates in human whole blood using imaging flow cytometry. Cytometry A. 2024; 105(5): 356-367, doi: 10.1002/cyto.a.24829
5. Markovic S., Li B., Pera V., Sznaier M., Camps O., Niedre M. A computer vision approach to rare cell in vivo fluorescence flow cytometry. Cytometry A. 2013; 83(12): 1113-1123, doi: 10.1002/cyto.a.22397
6. Pennati F., Belenkov S., Buccardi M., Ferrini E., Sverzellati N., Villetti G., Aliverti A., Stellari F.F. Multiphase micro-computed tomography reconstructions provide dynamic respiratory function in a mouse lung fibrosis model. iScience 2024; 27(3): 109262, doi: 10.1016/j.isci.2024.109262
7. Vincenzi E., Fantazzini A., Basso C., et al. A fully automated deep learning pipeline for micro-CT-imaging-based densitometry of lung fibrosis murine models. Respir Res 2022; 23(1): 308, doi: 10.1186/s12931-022-02236-x
8. Ji Y., Hwang G., Lee S.J., Lee K., Yoon H. A deep learning model for automated kidney calculi detection on non-contrast computed tomography scans in dogs. Frontiers in veterinary science 2023; 10: 1236579, doi: 10.3389/fvets.2023.1236579
9. Liu L., Cai B., Liu L., Zhuang X., Zhao Z., Huang X., Zhang J. Research on the morphological structure of partial fracture healing process in diabetic mice based on synchrotron radiation phase-contrast imaging computed tomography and deep learning. Bone Reports 2024; 20: 101743, doi: 10.1016/j.bonr.2024.101743
10. Mahmoodian N., Rezapourian M., Inamdar A.A., Kumar K., 1, Fachet M., Hoeschen C. Enabling Low-Dose In Vivo Benchtop X-ray Fluorescence Computed Tomography through Deep Learning-Based Denoising. J Imaging 2024; 10(6): 127, doi: 10.3390/jimaging10060127
11. Iizuka O., Kanavati F., Kato K., Rambeau M., Arihiro K., Tsuneki M. Deep Learning Models for Histopathological Classification of Gastric and Colonic Epithelial Tumours. Scientific Reports 2020: 10(1): 1504, doi: 10.1038/s41598-020-58467-9
12. Kather J.N., Pearson A.T., Halama N., et al. Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer. Nature Medicine 2019; 25(7): 1054-1056, doi: 10.1038/s41591-019-0462-y
13. Pereira T.D., Aldarondo D.E., Willmore L., Kislin M., Wang S.S.H., Murthy M., Shaevitz J.W. Fast animal pose estimation using deep neural networks. Nat. Methods 2019; 16(1): 117-125, doi: 10.1101/331181
14. Carreira M.J., Vila-Blanco N., Cabezas-Sainz P., Sánchez L. ZFTool: A Software for Automatic Quantification of Cancer Cell Mass Evolution in Zebrafish. Applied Sciences 2021; 11(16): 7721, doi: 10.3390/app11167721
15. Stefano A., Vernuccio F., Comelli A. Image Processing and Analysis for Preclinical and Clinical Applications. Applied Sciences 2022; 12(15): 7513, doi: 10.3390/app12157513
16. Khare S., Ho C., Kannan M., et al. 62 Applying machine vision to empower preclinical development of cell engager and adoptive cell therapeutics in patient-derived organoid models of solid tumors. Journal for ImmunoTherapy of Cancer 2021; 9, doi: 10.1136/jitc-2021-SITC2021.062
17. Guzman M., Geuther B., Sabnis G. Kumar V. Highly Accurate and Precise Determination of Mouse Mass Using Computer Vision. bioRxiv [Preprint] 2023:2023.12.30.573718, doi: 10.1101/2023.12.30.573718
18. Chien A., Tang H., Jagessar B., Chang K.-W., Peng N., Nael K., Salamon N. AI-Assisted Summarization of Radiologic Reports: Evaluating GPT3davinci, BARTcnn, LongT5booksum, LEDbooksum, LEDlegal, and LEDclinical American Journal of Neuroradiology 2024; 45(2): 244-248, doi: 10.3174/ajnr.A8102
19. Van Veen D., Van Uden C., Blankemeier L., et al. Adapted large language models can outperform medical experts in clinical text summarization. Nat Med 2024; 30(4): 1134-1142, doi: 10.1038/s41591-024-02855-5
20. Tie X., Shin M., Pirasteh A., et al. Personalized Impression Generation for PET Reports Using Large Language Models. J Imaging Inform. Med. 2024; 37(2): 471-488, doi: 10.1007/s10278-024-00985-3
21. Wu H.Y., Zhang J., Ive J., Li T., Gupta V., Chen B., Guo Y. Medical Scientific Table-to-Text Generation with Human-in-the-Loop under the Data Sparsity Constraint. arXiv preprint 2022; arXiv:2205.12368, doi: 10.48550/arXiv.2205.12368
The Use of Computer Vision Methods and Large Language Models for Preclinical Research
Authors
Gorbunova A. V.
Student, Faculty of Biotechnology1
Shmakova Y. V.
Student, Faculty of Pharmacy2
Kalugina O. F.
Student, Faculty of Medicine3
Prokhorov M. V.
Student, Faculty of Pharmacy4
Bobrov A. I.
Student, Institute for Clinical Medicine5
Koshechkin K. A.
Doctor of Pharmacy, Professor, Chair for Information and Internet Technologies5
1 - Lomonosov Moscow State University, Moscow, Russian Federation
2 - Saint Petersburg State Chemical and Pharmaceutical University, St. Petersburg, Russian Federation
3 - Yaroslavl State Medical University, Yaroslavl, Russian Federation
4 - Voronezh State University, Voronezh, Russian Federation
5 - I. M. Sechenov First Moscow State Medical University (Sechenov University), Moscow, Russian Federation
Corresponding author
Aleksandra V. Gorbunova; e-mail: gorbunova.av2002@yandex.ru
Conflict of interest
None declared.
Funding
The study had no sponsorship.
Abstract
Introduction. The article discusses the problem of using laboratory animals in preclinical research and, as a solution to this problem, the use of modern technologies like artificial intelligence. The aim of the work is to study the application of computer vision methods and large language models for preclinical research. Discussion. Nowadays scientists all over the world are actively trying to replace animal models in preclinical research with more modern solutions. Artificial intelligence plays an important role in this process. It allows us to make research faster and also to improve the quality of experiments, and therefore, it can lead to the decrease in the number of tests, that may turn out to be unjustified and, in most cases, fatal to animals. The use of AI in preclinical research makes it possible to conduct more accurate experiments, reduce the likelihood of unsuccessful research and increase the reliability of the results. It also allows us to reduce the number of animals which are used in experiments, which is one of the main aspects of bioethics. It is possible to reduce the suffering of animals and improve their protection from the negative effects of experiments by replacing them with computer models and AI-based virtual systems. Conclusions. The use of artificial intelligence in preclinical studies is one of the best ways to develop more ethical, accurate and effective scientific methods.
Key words
artificial intelligence, preclinical research, machine learning
DOI
References
1. Animals Used in Research. Animal Legal Defence Fund. Available at: https://aldf.org/focus_area/animals-used-in-research/ Accessed: 09.04.2024.
2. Lab to algorithm: AI's role in minimising animal testing. Deeper insights. Available at: https://deeperinsights.com/ai-blog/lab-to-algorithm-ai-role-in-minimising-animal-testing#:~:text=Replacing%20animal%20testing%20with%20AI,and%20prioritise%20substances%20more%20efficiently Accessed: 09.04.2024.
3. Goryachkin B.S., Kitov M.A. Komp'yuternoe zrenie. [Computer Vision.] E-Scio 2020; (9): 317-345. (In Russ.)
4. Poschkamp B., Bekeschus S. Convolutional neuronal network for identifying single-cell-platelet–platelet-aggregates in human whole blood using imaging flow cytometry. Cytometry A. 2024; 105(5): 356-367, doi: 10.1002/cyto.a.24829
5. Markovic S., Li B., Pera V., Sznaier M., Camps O., Niedre M. A computer vision approach to rare cell in vivo fluorescence flow cytometry. Cytometry A. 2013; 83(12): 1113-1123, doi: 10.1002/cyto.a.22397
6. Pennati F., Belenkov S., Buccardi M., Ferrini E., Sverzellati N., Villetti G., Aliverti A., Stellari F.F. Multiphase micro-computed tomography reconstructions provide dynamic respiratory function in a mouse lung fibrosis model. iScience 2024; 27(3): 109262, doi: 10.1016/j.isci.2024.109262
7. Vincenzi E., Fantazzini A., Basso C., et al. A fully automated deep learning pipeline for micro-CT-imaging-based densitometry of lung fibrosis murine models. Respir Res 2022; 23(1): 308, doi: 10.1186/s12931-022-02236-x
8. Ji Y., Hwang G., Lee S.J., Lee K., Yoon H. A deep learning model for automated kidney calculi detection on non-contrast computed tomography scans in dogs. Frontiers in veterinary science 2023; 10: 1236579, doi: 10.3389/fvets.2023.1236579
9. Liu L., Cai B., Liu L., Zhuang X., Zhao Z., Huang X., Zhang J. Research on the morphological structure of partial fracture healing process in diabetic mice based on synchrotron radiation phase-contrast imaging computed tomography and deep learning. Bone Reports 2024; 20: 101743, doi: 10.1016/j.bonr.2024.101743
10. Mahmoodian N., Rezapourian M., Inamdar A.A., Kumar K., 1, Fachet M., Hoeschen C. Enabling Low-Dose In Vivo Benchtop X-ray Fluorescence Computed Tomography through Deep Learning-Based Denoising. J Imaging 2024; 10(6): 127, doi: 10.3390/jimaging10060127
11. Iizuka O., Kanavati F., Kato K., Rambeau M., Arihiro K., Tsuneki M. Deep Learning Models for Histopathological Classification of Gastric and Colonic Epithelial Tumours. Scientific Reports 2020: 10(1): 1504, doi: 10.1038/s41598-020-58467-9
12. Kather J.N., Pearson A.T., Halama N., et al. Deep learning can predict microsatellite instability directly from histology in gastrointestinal cancer. Nature Medicine 2019; 25(7): 1054-1056, doi: 10.1038/s41591-019-0462-y
13. Pereira T.D., Aldarondo D.E., Willmore L., Kislin M., Wang S.S.H., Murthy M., Shaevitz J.W. Fast animal pose estimation using deep neural networks. Nat. Methods 2019; 16(1): 117-125, doi: 10.1101/331181
14. Carreira M.J., Vila-Blanco N., Cabezas-Sainz P., Sánchez L. ZFTool: A Software for Automatic Quantification of Cancer Cell Mass Evolution in Zebrafish. Applied Sciences 2021; 11(16): 7721, doi: 10.3390/app11167721
15. Stefano A., Vernuccio F., Comelli A. Image Processing and Analysis for Preclinical and Clinical Applications. Applied Sciences 2022; 12(15): 7513, doi: 10.3390/app12157513
16. Khare S., Ho C., Kannan M., et al. 62 Applying machine vision to empower preclinical development of cell engager and adoptive cell therapeutics in patient-derived organoid models of solid tumors. Journal for ImmunoTherapy of Cancer 2021; 9, doi: 10.1136/jitc-2021-SITC2021.062
17. Guzman M., Geuther B., Sabnis G. Kumar V. Highly Accurate and Precise Determination of Mouse Mass Using Computer Vision. bioRxiv [Preprint] 2023:2023.12.30.573718, doi: 10.1101/2023.12.30.573718
18. Chien A., Tang H., Jagessar B., Chang K.-W., Peng N., Nael K., Salamon N. AI-Assisted Summarization of Radiologic Reports: Evaluating GPT3davinci, BARTcnn, LongT5booksum, LEDbooksum, LEDlegal, and LEDclinical American Journal of Neuroradiology 2024; 45(2): 244-248, doi: 10.3174/ajnr.A8102
19. Van Veen D., Van Uden C., Blankemeier L., et al. Adapted large language models can outperform medical experts in clinical text summarization. Nat Med 2024; 30(4): 1134-1142, doi: 10.1038/s41591-024-02855-5
20. Tie X., Shin M., Pirasteh A., et al. Personalized Impression Generation for PET Reports Using Large Language Models. J Imaging Inform. Med. 2024; 37(2): 471-488, doi: 10.1007/s10278-024-00985-3
21. Wu H.Y., Zhang J., Ive J., Li T., Gupta V., Chen B., Guo Y. Medical Scientific Table-to-Text Generation with Human-in-the-Loop under the Data Sparsity Constraint. arXiv preprint 2022; arXiv:2205.12368, doi: 10.48550/arXiv.2205.12368