FAIR data a vliv AI na výzkum. V Miláně se diskutovalo o tom, proč je důležité oba aspekty propojit

Proč jsou FAIR data ve výzkumu neodmyslitelná? Které služby European Open Science Cloud (EOSC) mohou zlepšit produkci FAIR dat? Jak umělá inteligence (AI) zasahuje do vědeckých oborů a jak FAIR data pomáhají trénovat umělou inteligenci? Tyto a jiné otázky diskutovali zástupci evropských výzkumných infrastruktur a členové pracovní skupiny ESFRI-EOSC na workshopu „FAIR Data Productivity and Advanced Digitalization“ pořádaném Evropským strategickým fórem pro výzkumné infrastruktury (ESFRI), který proběhl ve dnech 23.-24. ledna na univerzitě v Miláně.

Smyslem workshopu bylo shromáždit názory odborníků z výzkumných infrastruktur na práci s FAIR daty a pokročilou digitalizací výzkumu a jejich představy o možnostech úspěšného naplňování iniciativy EOSC a Open Science. Nad otázkami důsledků propojení umělé inteligence a FAIR dat diskutovali odborníci z evropských výzkumných infrastruktur EPOS-ERIC, ESRF, CESSDA ERIC, CERN, ESCAPE, BBMRI-ERIC, CSIC, EGI Foundation, MARIS, CNRS LAPP, OSCARS, SoBigData, e-IRG Delegate, Computational Biology Research Centre of Human Technopole, zástupci EOSC a Evropské Komise.

Důvěryhodnost dat ve výzkumu je zcela zásadní a umělá inteligence by se mohla stát nástrojem testování kvality a původnosti vědeckých dat,“ řekl v úvodu setkání profesor fyziky z milánské univerzity a bývalý předseda ESFRI Giorgio Rossi, který rovněž zastupuje Itálii v řídícím výboru EOSC.

EOSC pro vědu, nebo věda pro EOSC?

Přednášejí v průběhu konference sdíleli dobrou praxi z práce s daty a službami, které poskytuje EOSC. Jako podstatné zástupci evropských výzkumných infrastruktur zmiňovali službu vlastní vědecké komunitě uživatelů, pokročilá metadata a udržení spolupráce v rámci doménově specifických výzkumných komunit, kde se dodržují principy FAIR dat. Naopak překážkami, které omezují datovou produktivitu, jsou nedostatečná školení a personální obsazení, neotevřenost dat pro všechny uživatele, férovost nových dat, skrytá data, která jsou dostupná pouze na vyžádání, což uživatelům brání v kombinování dat a získávání nových informací z FAIR datových sad.

Mezi služby poskytované EOSC, které by mohly zlepšit FAIR data, patří zavedení standardů pro interoperabilitu dat a podpora jejich přijetí a používání, speciální školící programy a zařízení na úrovni EU jako EOSC data space.

Obecně platí, že již 50 procent dat ve fázi produkce či postprodukce nese označení FAIR data,” zdůraznil Rossi.

FAIR výzkumné objekty jsou též nástrojem, o který se zajímá průmysl jako o produkty pro trh (příkladem jsou snímky z The European Synchrotron Radiation Facility v Grenoblu).

Odlišné přístupy

V roli mluvčího za The Consortium of European Social Science Data Archives (CESSDA) vystoupil Jindřich Krejčí ze Sociologického ústavu AV ČR, který zdůraznil tradici sdílení dat v sociologickém výzkumu a bottom-up přístup pro srovnávací výzkum a opětovné použití dat. “Budování konceptu sdílené datové kultury je neodmyslitelnou součástí výzkumu,” řekl Jindřich Krejčí.

Z jiného úhlu pohledu k problematice přistoupil Petr Holub z Biobanking and Biomolecular resources Research Infrastructure (BBMRI) a BioMedAI. Zdůraznil, že umělá inteligence má stále vzrůstající význam ve výzkumu v oblasti zdravotní péče. AI má nezastupitelnou roli v oblasti digitální patologie, která usnadňuje diagnostiku rakoviny a její léčbu. Pomáhá také při práci s anonymizací a syntézou dat pro jejich publikování, kde výzvou zůstává práce s citlivými daty. Holub ve svém svém příspěvku zdůraznil potřebu širší role EOSC, než jen jako zdroje financování.

Jan Hrušák z Ústavu fyzikální chemie J. Heyrovského AV ČR, který vedl závěrečnou panelovou diskuzi o AI zdůraznil, že: “Využitím možností AI ve výzkumných infrastrukturách při zpracování dat mohu vědci odhalit nové možnosti výzkumu, zefektivnit pracovní postupy a urychlit objevy v různých vědních oborech. Integrace umělé inteligence do výzkumných infrastruktur spolu se zpracování dat sice nabízí řadu výhod, ale zároveň sebou nese i řadu výzev. Expertů s odbornými znalostmi pro vývoj, implementaci a údržbu AI systémů je nedostatek. Školení a získávání kvalifikovaných pracovníků v oblasti technologií AI pro výzkumné účely stále zůstává výzvou.