留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

我国地理学研究的数据识别及应用特征——基于地理类中文核心期刊文献分析视角

上一篇

下一篇

王强, 丁恩俊, 刘愿理. 我国地理学研究的数据识别及应用特征——基于地理类中文核心期刊文献分析视角[J]. 西南师范大学学报(自然科学版), 2023, 48(1): 73-80. doi: 10.13718/j.cnki.xsxb.2023.01.010
引用本文: 王强, 丁恩俊, 刘愿理. 我国地理学研究的数据识别及应用特征——基于地理类中文核心期刊文献分析视角[J]. 西南师范大学学报(自然科学版), 2023, 48(1): 73-80. doi: 10.13718/j.cnki.xsxb.2023.01.010
WANG Qiang, Ding Enjun, LIU Yuanli. Research on Data Identification and Application Characteristics of Geographical in China——From the Perspective of Chinese Core Journal of Geography and Literature Analysis[J]. Journal of Southwest China Normal University(Natural Science Edition), 2023, 48(1): 73-80. doi: 10.13718/j.cnki.xsxb.2023.01.010
Citation: WANG Qiang, Ding Enjun, LIU Yuanli. Research on Data Identification and Application Characteristics of Geographical in China——From the Perspective of Chinese Core Journal of Geography and Literature Analysis[J]. Journal of Southwest China Normal University(Natural Science Edition), 2023, 48(1): 73-80. doi: 10.13718/j.cnki.xsxb.2023.01.010

我国地理学研究的数据识别及应用特征——基于地理类中文核心期刊文献分析视角

  • 基金项目: 中央高校基本科研业务费专项资金资助项目(SWU1909330);CALIS全国农学文献信息中心研究项目(2022063)
详细信息
    作者简介:

    王强,副研究馆员,硕士,主要从事学科信息服务的研究 .

  • 中图分类号: K90-09; G237.5

Research on Data Identification and Application Characteristics of Geographical in China——From the Perspective of Chinese Core Journal of Geography and Literature Analysis

  • 摘要: 数据是科学研究的基础,识别地理学研究领域数据来源及其特征对学科的理论研究和实际应用都具有重要的现实意义. 以2000年以来5种地理学中文核心期刊所刊载的学术性论文为样本,采用文献内容分析、文献计量、CiteSpace与编码相结合的方法对这些论文使用的数据进行识别、归类,并探索这些数据的获取方式以及在地理学中的应用特征. 结果表明:高频使用数据主要有面板数据、遥感影像、调查数据、TM数据、空间数据、遥感数据、Landsat数据、NDVI数据、人口普查数据和MODIS数据等;使用高频数据的文献聚集主题主要为土地利用、时空分异、青藏高原、长江经济带、旅游交通、位置定位、气温降水等;数据获取方式及渠道主要有WoS等数据库、政府部门官网、百度腾讯等企业、调研实测和卫星遥感;地理学研究数据的获取方式及载体形式呈现多样化现代化,数据内容与人类社会活动密切相关、时代性特征明显,且人文地理类数据类型更丰富.
  • 加载中
  • 表 1  人文地理学数据识别及归类

    一级主题 二级主题 数据名称
    经济地理 就业 劳动力数据、招聘类数据、前程无忧、就业数据、收入数据、CHIP数据
    养老餐饮 养老机构数据、餐饮数据、食物消费数据
    大金融 中国金融数据、银行网点数据、贷款数据、保险业数据
    产业 产业普查、产业数据、行业数据、工业增加值、工业产值数据
    制造业 制造业企业数据、制造业数据
    贸易 中国海关数据、贸易数据、进出口数据、海关信息、航运贸易、产品贸易、出口数据
    零售业 零售业大数据、零售业数据
    投资产出 投资数据、OFDI数据、研发数据、投资数据、投入产出数据、成本收益数据
    交易消费 交易数据、供应商数据、全球跨境并购交易记录数据、消费数据、支付数据
    经济状态 经济发展、经济截面、经济面板、经济普查、经济统计、GDP数据、生产总值
    企业店铺 企业数据、淘宝数据、天眼查、商业数据、上牌登记数据、企业大数据、企业年报、兴趣面数据、合同数据、工商企业登记注册数据
    人口地理 人口统计 人口流量、常住人口、户籍人口、人口普查、人口调查、人口数据、人口统计、LandScan数据、三普、四普、五普、六普、人口空间数据、人口分布数据、年龄数据
    人口变化 人口变化、人口流动、流动人口数据
    人口迁移 人口迁徙大数据、迁徙数据、人口迁移数据、省际迁移数据等
    旅游地理 旅游 途牛、大众点评、UGC数据、景观生态数据、客源市场、旅游经济、旅游统计、旅游微博、旅游政务网、民宿数据、穷游网、去哪儿网、游客量数据、客流数据、Airbnb、WTTC数据等
    乡村地理 农村经济 沟域经济数据、农村经济、农业保险数据
    村庄农户 村落数据、村庄数据、农户数据、贫困村数据
    科技文化地理 专利科技 产业合作专利数据、发明专利、全球专利统计数据、专利合作、专利申请、专利交易、专利权转移、专利转让记录
    文化 文化贸易数据、文化企业数据
    城市地理 城市用地住房建筑 居安客、城市建设用地、地价数据、地块数据、房产数据、房地产交易、居住用地、容积率、房价、建设用地、建筑普查、建筑数据、租金数据、建成区比率数据
    城市特征 城市化水平、城市面板数据、城市数据、城市特征、城市统计年鉴、城镇化发展数据
    其他 城市边界解译数据、城市地表信息、城镇人口、舒适物指标数据
    交通地理 快递物流 货物运输、货流、货运、航运、快递、铁路、吞吐量、物流、运单数据、中国邮政
    客运 客运流、客运数据、客运班列、客运量、时刻表数据、铁路班次数据
    海陆空运输及路网 出租车、道路网络、地铁系统、浮动车、高速公路、高铁、公交、公路网、航空、航线、交通路网、路网、AIS数据
    交通出行 O-D数据、出行数据、出行调查、交通流量、交通态据、居民出行、携程网
    其他 交通事故数据、交通投资数据
    社会地理 社会社交 社会调查、国情普查、基础设施、民政数据、县域数据、社会发展、社会化网络、社交媒体、社交网络大数据、CFPS、CGSS数据
    历史地理 历史文献 历史地图、历史数据、历史水文资料、历史图件、历史文献、档案资料、考古资料、史志文献
    其他 犯罪警情 犯罪案件、恐袭数据、扒窃报警、警情数据
    其他 签到数据、乡镇数据、项目村数据、专业村数据、机构分布、行政边界、行政区划调整
    下载: 导出CSV

    表 2  自然地理学数据识别及归类

    一级主题 二级主题 数据名称
    大气候 温度气温 气温、温度、气温空间插值、气温资料、温度数据、SST数据、积雪数据、太阳辐射
    气候气象 古气候、气候变化、气候格点、气候观测、气候情景、气象观测、气象监测、气象灾情、气象站点、气象资料、情景气候、NCEP/NCAR、PDSI、NCEP-CFSR、CMIP5、IPCC数据
    水汽湿度 湿度、水汽通量、水文气象、蒸发皿数据、蒸散发、蒸散观测数据
    其他 风力侵蚀、风向风速、辐射率、辐射数据、尘暴监测数据
    地形地貌 冰川 冰川编目、海冰、物质平衡观测、数字高程模型、雷达测厚数据
    河流湖泊 含沙量、河道地形、河道普查、河道演变空间、湖底地形、泥沙数据、全球河流数据、输沙量数据、水沙数据、悬沙浓度、高程测量
    陆地 陆地、石漠化、水土流失、坡度数据
    海洋海岸 海岸线、潮汐数据
    综合类 地表参数、地貌、地面调查、地面观测、地面监测、地形数据
    水文 水质 地下水质、水质监测、水质数据
    降水降雨 ISLSCP降水、降水观测、降水量、雨强、降雨量、径流、水流数据
    水位水深 水位、蓄水、地下水、水深测量、水深点、水尺记录
    综合类 水文、水系、水利普查、监测井、淡水条约数据、水文观测
    其他 土壤水、水化学、同位素数据
    沉积 沉积 沉积测年、沉积年代、粒度测量数据
    植物地理 森林植被 GIMMS NDVI、产草量、NPP、林线、森林类型、植被类型、植被生态、植被指数
    其他 开花始期、生物量、物候观测
    生态 生态 生态环境要素、生态实测、生态系统
    下载: 导出CSV

    表 3  地理信息科学及其他数据识别及归类

    一级主题 二级主题 数据名称
    环境 空气质量 空气质量、浓度观测、浓度数据、PM10、PM2.5、光学厚度
    气体排放 排放历史、排放量、碳排放、有机碳、污染物排放、环境污染
    其他 资源环境、地理环境、环境调查、环境数据
    农业 农作物 播种面积、灌溉分布、粮食产量、粮食贸易、粮食生产、粮食种植
    农田耕地 耕地、垦田、田亩、退耕还林
    农业统计 农业调查、农业统计
    土地 土地利用 土地覆被、土地覆盖、土地利用、用地数据、LUCC、LULC数据
    土地变更 土地详查、土地变更、土地现状、地籍调查、二调、土地调查
    灾害 灾害灾情 涝点、泥石流、气象灾情普查、内涝损失、灾害灾情
    资源 能源资源 煤炭、能源、能耗、天然气、原油、石油
    其他资源 森林资源、水资源、资源数据
    规划 规划 总体规划、城市规划、区域规划、土地规划
    土壤 土壤 土壤调查、土壤肥力、土壤类型、土壤普查、CRI、Noah、SOTER数据
    地理信息系统 卫星遥感 光谱、SRTM、环境星CCD、红外、卫星遥感、卫星影像、DMSP/OLS、Google Earth、GPS、Landsat、Quick Bird、SPOT、TM、灯光影像、SRTM、ASTER、AVHRR-NDVI、AVHRR、ECV、ERA、ETM、MODIS、MSS、NOAA AVHRR、NOAA/AVHRR、EVI、遥感监测、遥感数字图像、遥感影像、夜光/大气遥感、夜间灯光、DEM、Sentinel、IRS数据
    图像摄影 海图、古地图、街景、军事地形图、电子地图、航片、时间序列影像、图像、照片数据
    位置定位 定位、兴趣点、POI、百度地图、腾讯地图、高德地图、位置大数据、位置数据、LBS、分布数据、移动轨迹、行为轨迹
    综合类 GIS、空间分布、空间关系、空间观测、空间属性、时空变化、时空数据、基础地理、地理大数据、地理空间、地理信息、地理行为、多源地学、多源空间数据、多源时空
    教育医疗 教育 留学生流动数据
    医疗 病例数据、肺癌发病数据
    其他 数据库 中国知网、CNKI、CSCD、CSSCI、GDELT、JCR、Scopus、Springer、Web of Science(WOS)、读秀、万据、维普、SSCI、CCND数据
    网络平台 赶集网、百度、京东、网格模拟、网络点评、网络关注、网络文体、微博、新浪、阿里巴巴
    文献分析 论文合著、论文、全文、文本、文献、引文数据
    新闻 新媒体网络、新闻媒体、新闻事件、新闻数据
    手机通信 手机供应商、手机基站、手机交易记录、手机网络、手机信令、通信数据
    下载: 导出CSV
  • [1] 廖小罕, 封志明, 高星, 等. 野外科学观测研究台站(网络)和科学数据中心建设发展[J]. 地理学报, 2020, 75(12): 2669-2683. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202012010.htm
    [2] GOODCHILD M F, GUO H, ANNONI A, et al. Next-Generation Digital Earth[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(28): 11088-11094. doi: 10.1073/pnas.1202383109
    [3] 程昌秀, 史培军, 宋长青, 等. 地理大数据为地理复杂性研究提供新机遇[J]. 地理学报, 2018, 73(8): 1397-1406. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201808002.htm
    [4] 王戈飞, 张佩云, 梁枥文, 等. 地理信息系统与大数据的耦合应用[J]. 遥感信息, 2017, 32(4): 146-151. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-YGXX201704022.htm
    [5] 张颖超. 大数据对高等教育发展的影响研究[D]. 重庆: 重庆大学, 2016.
    [6] 任一明, 贾同. 论大数据与我国高等教育发展的相互作用[J]. 东北师大学报(哲学社会科学版), 2016(4): 171-175. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DBSS201604034.htm
    [7] 黄欣荣. 大数据对科学哲学的新挑战[J]. 新疆师范大学学报(哲学社会科学版), 2016, 37(3): 133-139. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XJSF201603017.htm
    [8] 董艳丽. 大数据的哲学研究[D]. 西安: 陕西师范大学, 2015.
    [9] 李国杰, 程学旗. 大数据研究: 未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27(6): 647-657. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-KYYX201206000.htm
    [10] 杨振山, 龙瀛, Nicolas DOUAY. 大数据对人文—经济地理学研究的促进与局限[J]. 地理科学进展, 2015, 34(4): 410-417. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ201504003.htm
    [11] 甄峰, 王波. "大数据"热潮下人文地理学研究的再思考[J]. 地理研究, 2015, 34(5): 803-811. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ201505002.htm
    [12] 马振刚, 李黎黎, 许学工. 自然地理学的大数据研究[J]. 地理与地理信息科学, 2015, 31(3): 54-58, 64. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201503011.htm
    [13] 裴韬, 刘亚溪, 郭思慧, 等. 地理大数据挖掘的本质[J]. 地理学报, 2019, 74(3): 586-598. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201903015.htm
    [14] 程先富. 地理科学概论[M]. 合肥: 安徽人民出版社, 2008: 18-20.
    [15] 刘俊楠, 刘海砚, 陈晓慧, 等. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7): 1476-1486. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202007008.htm
    [16] 易琳. 地理数据多尺度特征提取与结构解析方法研究[D]. 南京: 南京师范大学, 2015.
    [17] HOLSTIOR. Content Analysis for the Social Sciences and Humanities[M]. Reading, MA: Addison-Wesley, 1969.
    [18] 徐建平, 张厚粲. 质性研究中编码者信度的多种方法考察[J]. 心理科学, 2005, 28(6): 1430-1432. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XLKX200506035.htm
    [19] 张生瑞, 王英杰, 张桐艳, 等. 基于跨省界自然地理实体地名空间格局的行政管理优化[J]. 地理学报, 2019, 74(4): 797-813. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201904014.htm
    [20] 蒋依依, 温晓金, 刘焱序. 2001—2015年中国出境旅游流位序规模演化特征[J]. 地理学报, 2018, 73(12): 2468-2480. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201812015.htm
    [21] 马彬, 张勃. 基于格点数据的1961—2016年中国气候季节时空变化[J]. 地理学报, 2020, 75(3): 458-469. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202003003.htm
    [22] 赵鹏军, 吕迪. 中国小城镇镇区土地利用结构特征[J]. 地理学报, 2019, 74(5): 1011-1024. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201905014.htm
    [23] 赵莎, 胡最, 郑文武. 中国"胡焕庸线"东西两侧能源消耗空间格局的系统动力学模拟[J]. 地理科学进展, 2021, 40(8): 1269-1283. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ202108002.htm
    [24] 刘海洋, 王录仓, 李骞国, 等. 基于腾讯人口迁徙大数据的黄河流域城市联系网络格局[J]. 经济地理, 2020, 40(4): 28-37. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JJDL202004004.htm
    [25] 彭诗尧, 陈绍宽, 许奇, 等. 基于POI的土地利用与轨道交通客流的空间特征[J]. 地理学报, 2021, 76(2): 459-470. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202102016.htm
    [26] 丁亮, 钮心毅, 宋小冬. 基于个体移动轨迹的多中心城市引力模型验证[J]. 地理学报, 2020, 75(2): 268-285. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202002006.htm
    [27] 宋昊泽, 杨小平, 穆桂金, 等. 罗布泊地区雅丹形态特征及演化过程[J]. 地理学报, 2021, 76(9): 2187-2202. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202109012.htm
    [28] 李佳, 陈佳, 杨新军. 旅游社会—生态系统的运行机制——以西安市上王村为例[J]. 地理研究, 2015, 34(5): 977-990. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ201505017.htm
    [29] 王泽东, 张小林, 袁源, 等. 高等教育用地集约利用的分异特征及其影响因素——基于山东省124个高校校区调研数据[J]. 经济地理, 2020, 40(10): 164-170. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JJDL202010019.htm
    [30] 刘纪远, 刘文超, 匡文慧, 等. 基于主体功能区规划的中国城乡建设用地扩张时空特征遥感分析[J]. 地理学报, 2016, 71(3): 355-369. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201603002.htm
    [31] 范科科, 张强, 史培军, 等. 基于卫星遥感和再分析数据的青藏高原土壤湿度数据评估[J]. 地理学报, 2018, 73(9): 1778-1791. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB201809014.htm
    [32] 刘睿, 冯敏, 孙九林, 等. 基于环境减灾卫星CCD数据与决策树技术的植被分类研究[J]. 地理科学, 2012, 32(12): 1488-1495. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLKX201212010.htm
  • 加载中
表( 3)
计量
  • 文章访问数:  3659
  • HTML全文浏览数:  3659
  • PDF下载数:  858
  • 施引文献:  0
出版历程
  • 收稿日期:  2022-07-07
  • 刊出日期:  2023-01-20

我国地理学研究的数据识别及应用特征——基于地理类中文核心期刊文献分析视角

    作者简介: 王强,副研究馆员,硕士,主要从事学科信息服务的研究
  • 1. 西南大学 图书馆,重庆 400715
  • 2. 重庆工商大学 工商管理学院,重庆 400067
基金项目:  中央高校基本科研业务费专项资金资助项目(SWU1909330);CALIS全国农学文献信息中心研究项目(2022063)

摘要: 数据是科学研究的基础,识别地理学研究领域数据来源及其特征对学科的理论研究和实际应用都具有重要的现实意义. 以2000年以来5种地理学中文核心期刊所刊载的学术性论文为样本,采用文献内容分析、文献计量、CiteSpace与编码相结合的方法对这些论文使用的数据进行识别、归类,并探索这些数据的获取方式以及在地理学中的应用特征. 结果表明:高频使用数据主要有面板数据、遥感影像、调查数据、TM数据、空间数据、遥感数据、Landsat数据、NDVI数据、人口普查数据和MODIS数据等;使用高频数据的文献聚集主题主要为土地利用、时空分异、青藏高原、长江经济带、旅游交通、位置定位、气温降水等;数据获取方式及渠道主要有WoS等数据库、政府部门官网、百度腾讯等企业、调研实测和卫星遥感;地理学研究数据的获取方式及载体形式呈现多样化现代化,数据内容与人类社会活动密切相关、时代性特征明显,且人文地理类数据类型更丰富.

English Abstract

  • 大数据、云时代的到来为地理科学研究提供了新的机遇和挑战. 1999年中国科学院联合19个部委主持召开国际数字地球会议,2019年,国际数字地球学会中国国家委员会在北京召开“首届中国数字地球大会”,中国科学院地理科学与资源研究所建立了多个国家级野外观测研究网络和科学数据中心[1]. GoodChild[2]于2012年发表论文“Next-generation Digital Earth”,程昌秀等[3]指出大数据对地理学的研究方法、研究进展提供了新的挑战和机遇,王戈飞等[4]利用相关数据对大规划、地理信息系统、地理信息产业发展等领域进行了分析研究. 综上,这些研究从某种程度上说明数据在地理科学研究领域扮演着不可或缺的角色.

  • 数据已被广泛应用于教学科研、管理、生产生活的方方面面,科学合理地使用数据对提高科研水平、推进创新等具有重要作用. 如,在教育研究领域,张颖超[5]就大数据对高等教育发展影响进行了系统的分析;任一明等[6]指出大数据对高等教育的研究、创新、发展发挥着巨大的影响. 在哲学研究领域,黄欣荣[7]研究发现,数据将成为科学研究的新对象,大数据可能带来科学研究范式的变革,数据解释将成为科学说明的新模式;董艳丽[8]对大数据所涉及的哲学内涵进行挖掘. 在经济学领域,麦肯锡研究机构肯定了大数据对于提升各个商业领域价值创造力的巨大潜能,世界经济论坛甚至将大数据定义为类似于黄金或货币一样的新经济资产,李国杰等[9]指出,在未来科技及经济社会发展进程中,大数据将扮演重要角色. 在地理学科领域,杨振山等[10]与甄峰等[11]指出,大数据的发展对完善人文—经济地理学学科思维和研究方法将起到积极的推动作用;马振刚等[12]研究了自然地理学的大数据源及相关变革;裴韬等[13]揭示了地理大数据的本质特点,对地理大数据挖掘方法进行了分类.

    综上研究大多是从如何利用数据以及如何应对大数据对学科发展带来的机遇、挑战等方面进行研究,而基于文献内容计量学分析视角,系统梳理某一学科领域内数据来源的识别、归类及应用特征的文献较少. 基于此,本文采用文献分析计量与编码相结合的方法对地理学研究领域中的数据名称进行识别、分类,探索这些数据获取方式以及在地理学科领域中的应用特征,以期为地理学学科发展及相关研究提供参考.

  • 本文选取同时被中国社会科学引文索引(CSSCI)、中国科学引文数据库(CSCD)收录,且具有较好代表性的《地理学报》《地理科学》《地理研究》《地理科学进展》和《经济地理》5种期刊2000年以来发表的所有论文为样本,采用人工编码与数据抽取相结合的方法对这些论文所使用的数据进行标识、分类,探究地理学科领域数据获取方式及应用特征.

    在中国知网(CNKI)检索获取上文所述5种地理学核心期刊刊载的中文文献的题录信息,包括题名、作者、关键词、摘要、发表时间等,采用高级检索方式进行检索,检索式为:文献来源= (地理学报+ 地理科学+ 地理研究+ 地理科学进展+ 经济地理);检索时间跨度为2000年1月1日至2021年12月31日. 共获取文献24 974篇,剔除图书推介、刊物简介、会议纪要、讲话、通知、贺词等文章,共获取可编码文献24 903篇.

  • 第一步,因文献题录信息总数据量较大,由2名编码人员在充分熟悉编码方案后,采用人工编码和自动抽取相结合的方式对数据名称进行编码,在参考地理科学研究常用数据相关文献的基础上[14-16],对所获取的题录信息按照编码方案进行识别、统计分析,具体的编码方案见表 1表 3,主要处理步骤如下.

    由2名编码人员对选取的《地理学报》所载的6 037篇论文进行人工编码,通过进一步讨论形成数据名称词集合,编码完成后对编码结果进行信度检验,使用编码交互判别信度K计算编码的一致性[17].

    根据公式$ T_{a b}=\frac{2 N_{a b}}{M_a+M_b} $得到2位编码者之间的平均相互同意度,其中Nab表示2名编码人员结果一致的编码数量;MaMb分别表示ab2名编码人员各自的编码数量;

    利用公式$ K=\frac{n \times T}{1+(n-1) \times T}$计算编码交互判别信度,其中n表示编码人员数量;T表示平均相互同意度,最终得到编码交互判别信度K=0.82. 编码人员对相同内容判断的一致性越高,内容分析的可信度也越高[18]. K值高于0.8表明2位编码人员的编码结果一致性较好.

    第二步,使用Visual Basic对数据名称词集合与题录信息内容进行自动识别匹配,若数据名称集合中的词与题名、关键词及摘要等内容的词实现完全匹配,则对该文献自动编码,形成自动编码的数据名称数据集.

    第三步,对于利用数据名称集合无法自动识别编码的文献,采用人工编码的方式完成文献的编码. 最后,对每类数据名称的出现频次进行统计分析.

  • 人文地理类数据来源主要类别有经济地理、人口地理、娱乐地理、城市地理、交通地理. 统计发现,出现频次前10的数据名称有就业类数据、产业企业类数据、贸易数据、交易消费数据、人口统计类数据、旅游数据、房价地价类数据、快递物流数据、客运货运数据、经济状态类统计数据. 从以上统计数据及表 1可知,人文地理类数据品目种类多、来源丰富,且与人类生产生活密切相关.

  • 自然地理学数据来源类别主要有大气候、地形地貌、水文、植物地理,由于自然地理学本身更加注重自然地理环境的组成、形成发展及空间分异规律研究,出现频次较高的数据有温度气温类数据、气候气象类数据、水汽温度类数据、地表河流地形类数据、水土水沙类数据、水质水位数据、降水降雨类数据、森林植被类数据. 从以上统计数据及表 2来看,自然地理环境要素与人类活动的关系越密切,就越容易受到关注,相关的研究及数据也会越多,如气温温度、气候气象、水位水质等.

  • 对识别出的地理信息科学数据名称进行统计分析发现,其数据来源主要类别有环境地理、农业地理、人地关系、能源、卫星遥感、位置定位等,出现频次靠前的数据名称有空气质量类数据、气体排放类数据、农作物类数据、土地利用变更类数据、能源资源类数据、卫星遥感类数据、位置定位类数据. 从以上统计数据及表 3来看,地理信息科学数据品目种类多,与人类生产、生活相关的数据出现频次较高,数据获取的方式有卫星遥感、图像摄像、数据库、网络平台.

  • 对样本期刊所刊载的789种数据类型名称在论文中的分布情况进行统计发现,约33.2%的数据类型仅被1篇论文使用,30.1%数据类型被5篇或5篇以上的论文使用. 依据使用频次统计,地理学使用频次靠前的数据名称有面板数据、遥感影像、调查数据、TM数据、空间数据、遥感数据、Landsat数据、NDVI数据、人口普查数据、MODIS数据、观测数据、土地利用数据、历史文献数据、POI数据、ETM数据、气象数据、影像数据、降水数据、企业数据、DEM数据、人口数据、统计年鉴、实测数据、监测数据、气温资料、SPOT数据、百度数据、夜间灯光数据.

  • 利用CiteSpace软件对地理学高频使用数据的文献研究主题进行聚类分析发现,地理学高频使用数据的文献研究主题主要聚焦于土地利用、时空分异、青藏高原、长江经济带、房价、经济贸易、社会经济、旅游、交通出行、快递物流、人口地理、能源资源、位置定位、气候气象、气温降水等.

  • 地理科学研究常用的国内外商业数据库有CNKI、万方、维普、CSSCI、WOS、SSCI、JCR. 有学者根据研究需要,自建某专题类数据库/集,如中国科学院张生瑞等[19]构建了全国跨省界自然地理实体地名数据库,中国旅游研究院蒋依依等[20]构建了2001-2015年中国出境游客与目的地入境游客规模数据库.

  • 官方网站数据主要为政府各职能部门、各行业类官方统计数据,常见的有住房和城乡建设部、农业农村部、自然资源部、海关、气象局、企业类官方数据. 例如,选取国家气象信息中心发布的数据分析中国常年气候季节空间变化[21],利用住房和城乡建设部发布的数据分析中国小城镇镇区土地利用结构特征[22],利用中国能源统计年鉴发布的数据构建能源消耗空间格局预测模型[23].

  • 常见的企业平台有百度、腾讯、美团、饿了么、中国移动、高德地图、携程. 刘海洋等[24]基于腾讯人口迁徙大数据研究了黄河流域城市联系网络格局;彭诗尧等[25]利用百度地图POI数据分析轨道交通客流的空间特征;丁亮等[26]基于移动通信用户的个体移动轨迹数据,验证多中心城市引力模型.

  • 调研实测是获取地理学数据最重要的基本方法,可直接收集第一手资料. 例如,宋昊泽等[27]根据野外实测数据和小型无人机所摄地景影像,采用地形数字化方法提取地貌原始数据,分析描述罗布泊地区雅丹形态特征及演化过程;李佳等[28]通过实地调查和访谈获取数据分析了旅游社会—生态系统的内部运行机制;王泽东等[29]基于山东省124个高校校区的调研数据,对高等教育用地的时空演化特征进行了系统阐述.

  • 地域性、空间性是地理学科重要特征,卫星遥感技术是获取该类数据的重要方式. 例如,刘纪远等[30]基于遥感数据分析了中国城乡建设用地扩张时空特征;范科科等[31]基于卫星遥感数据对青藏高原土壤湿度数据进行了评估;刘睿等[32]基于环境减灾卫星CCD数据对呼伦贝尔地区植被分类进行了研究.

  • 对识别出的数据名称进行统计发现,地理信息科学数据的种类较多,尤以人文地理类数据种类最丰富、数量最多. 人文地理、地理信息科学类数据与其他学科的交叉性、融合性更强,其所涉及的学科面更广、更丰富.

  • 数据信息的获取方式及载体形式更加多样化、现代化. 统计发现,地理类数据主要获取方式有调研实测、官方网站、商业数据库、卫星遥感、手机APP、企业平台等. 近年,通过手机APP、卫星遥感、大数据等现代化手段获取数据的方式越来越多. 数据的载体形式主要有图书、期刊论文、学位论文、会议论文、图片影像、地图、古籍历史资料、报纸报告、专利、统计年鉴、遥感软件等,近年来,数据载体类型有由纸本化向电子化、数字化转变的趋势.

  • 对识别出的数据统计分析发现,数据内容与人类生产、生活密切相关,如天气预报(气候气象)、吃喝欢乐(粮食、旅游等)、衣食住行(房价、交通等)、医疗教育等,这些事物的空间性、地域性都是地理学科研究领域涉及的范围,也是由地理学学科特性的综合性、社会性所决定.

  • 时代性特征明显. 无论是数据内容的研究主题,还是数据获取方式、载体形式都随着时代的进步而发展,体现出鲜明的时代性特征. 数据研究主题与时俱进,如快递物流、空气质量、环境污染、城市房价、交通出行、POI等;数据获取方式、载体形式亦是如此,数据获取远程化、现代化,数据载体电子化、现代化,如无人机、遥感卫星、GIS软件、电子书刊等.

  • 本文研究发现,地理学研究高频使用的数据有经济人口数据、遥感影像、空间数据、调查数据、城市及旅游类数据等;高频数据文献聚焦主题于时空分异、经济贸易、青藏高原、长江经济带、旅游交通、位置定位、气温降水等;数据获取方式主要有数据库、官方数据网站、企业、调研实测和卫星遥感;数据特征为人文地理类数据更丰富,数据获取方式及载体形式现代化,数据内容与人类社会活动密切相关,时代性特征明显.

    对地理学研究领域数据的识别及应用特征的分析,既有利于结合社会实践,解决实际问题,也利于推动地理学理论与技术、方法的不断创新,对地理学研究具有重要的现实意义.

参考文献 (32)

目录

/

返回文章
返回