从DOI.org读取元数据#

在本笔记本中,我们将访问https://doi.org上记录的元数据。

import requests
import json

为此,我们编写一个小的辅助函数。

def read_doi(doi):
    """
    Reads meta data of records in doi.org.
    """

    doi = doi.replace("https://doi.org/", "")
    url = "https://doi.org/api/handles/" + doi
    
    # Download the file
    response = requests.get(url)
    data = response.json()
    return data

然后我们可以调用该函数并将结果存储在一个data对象中。

data = read_doi("https://doi.org/10.5281/zenodo.3833824")
data
{'responseCode': 1,
 'handle': '10.5281/zenodo.3833824',
 'values': [{'index': 100,
   'type': 'HS_ADMIN',
   'data': {'format': 'admin',
    'value': {'handle': '10.admin/codata',
     'index': 300,
     'permissions': '111111111111'}},
   'ttl': 86400,
   'timestamp': '2020-05-19T10:28:11Z'},
  {'index': 1,
   'type': 'URL',
   'data': {'format': 'string', 'value': 'https://zenodo.org/record/3833824'},
   'ttl': 86400,
   'timestamp': '2020-05-19T10:28:11Z'}]}

这个json对象由Python字典和列表组成。我们可以通过这些来导航并提取信息。

data['values'][0]
{'index': 100,
 'type': 'HS_ADMIN',
 'data': {'format': 'admin',
  'value': {'handle': '10.admin/codata',
   'index': 300,
   'permissions': '111111111111'}},
 'ttl': 86400,
 'timestamp': '2020-05-19T10:28:11Z'}

练习#

找出上述DOI的作者。