Новый тип данных в Dimensions - Datasets

Москва. 5 февраля. ИНТЕРФАКС – Разработанная компанией Digital Science платформа Dimensions теперь будет включать более 1,4 млн наборов данных в качестве нового типа контента. Такие наборы данных будут доступны всем пользователям, включая тех, кто использует бесплатную версию Dimensions. Представляем вашему вниманию краткий анализ новых возможностей этой платформы.

Большинство исследователей и администраторов исследований - международных и российских - знают и работают в наукометрической системе принципиально иной по сравнению с признанными конфигурацией Dimensions от технологической компании Digital Science. Разработанная Digital Science в сотрудничестве с более чем сотней ведущих исследовательских организаций мира, Dimensions, объединяет данные о научных грантах, публикациях, цитировании публикаций, альтернативных метриках публикаций (т.н. Altmetrics), клинических испытаниях, патентах, а теперь и наборы данных в рамках единой платформы, которая позволяет пользователям быстрее находить и получать доступ к наиболее актуальной информации, анализировать как академические, так и прикладные результаты исследований, а также собирать информацию, необходимую для формирования будущих стратегий и планов развития систем R&D и образования любого уровня – от институционального до глобального.

Теперь подробнее о наборах данных – т.н. DataSet.

29 января 2020 года компанией объявлено о включении в платформу Dimensions более 1,4 млн наборов данных в качестве нового типа контента. Эти наборы данных будут доступны всем пользователям, включая даже тех, кто использует бесплатную версию Dimensions.

Наборы данных - шестой тип данных, добавляемых в Dimensions после грантов, публикаций, цитирования, альтернативных метрик, клинических испытаний и патентов.

Наборы данных поступают из множества независимых репозиториев (Dryad, Zenodo, Pangea, других) и репозиториев, размещенных на сайте Figshare, включая ACS и NIH. Наборы данных определяются как элементы, совместно используемые в репозиториях; исключаются препринты, плакаты, изображения и программное обеспечение. Наборы данных обновляются ежедневно, добавляются данные новых репозиториев.

Дальнейшие планы по развитию наборов данных изложены в специальном разделе сайта платформы.

Кристиан Герцог, генеральный директор Dimensions отметил: "С момента создания Союза исследовательских данных в 2013 году ускорилось принятие наборов данных в качестве первоклассных результатов исследований: многие учреждения, издатели и финансирующие организации поощряют публикацию исследовательских данных и их использование. Хотя наборы данных уже отображаются на страницах подробной информации о публикации в Dimensions, в настоящее время мы делаем их доступными для поиска в качестве самостоятельного типа данных - но интегрированными в общий контекст с грантами, публикациями, клиническими испытаниями, патентами и нормативными документами".

Система Dimensions интегрировала мировые датасет репозитории, многие крупнейшие издатели уже приняли решение хранить исходные данные по публикациям на платформе Figshare как наиболее технологически продвинутой. Список некоторых издателей: 

 Включение наборов данных в контекст прочих доступных в системе данных позволит исследовательским организациям выявлять и анализировать тенденции в области общедоступных данных на институциональном уровне и обеспечит доступ к еще большему объему взаимосвязанных данных на одной платформе, нежели чем разрозненные базы данных.

"Наборы данных - это важные научно-исследовательские результаты, в которых заинтересованы многие из наших пользователей", - говорит К.Герцог. "Ученые могут найти данные для повторного использования, финансирующие организации смогут анализировать влияние грантов, это также будет полезно для организаций, заинтересованных в том, чтобы сделать свои данные более доступными и открытыми, в том числе для издателей, рассматривающих вопрос о том, где хранятся эти наборы данных, и публикации с соответствующими наборами данных".

Марк Ханел, генеральный директор и основатель компании Figshare, добавляет: "Введение наборов данных в Dimensions демонстрирует стремление Digital Science поднять данные на первоклассный уровень, что является первым шагом на пути к тому, что мы видим длительным и сложным, но стоящим усилий. Открытые данные должны и будут являться нормой в академических исследованиях".

Вот так выглядят распределение наборов данных в Dimensions по годам происхождения и распределение наборов данных по отраслям науки:

А вот так выглядит распределение наборов данных по репозиториям стран – лидеров R&D:

 И наконец, так выглядит распределение российских исследовательских организаций (университеты и НИИ) – лидеров в использовании наборов данных, индексируемых Dimensions в категории – Dimensions -> Datasets -> Research Organization -> Location -> Russia: