Datago新闻及社交媒体量化舆情数据库相关信息

发布时间:

Datago新闻及社交媒体量化舆情数据库相关信息

一、简介
Datago新闻及社交媒体量化舆情数据库重点关注蕴含在海量非结构化文本数据中的金融信息,并利用大数据分析技术、自然语言处理等人工智能技术对原始文本数据进行清理及量化分析。
《报刊新闻量化舆情数据库》以香港中文大学、美国斯坦福大学和南加州大学等高校商学院教授的相关学术研究为指导,借鉴RavenPackThomsonReuters等国际成熟数据平台设计,对1998年起由中文报刊媒体发布的与A股(及B股)全部上市公司相关新闻进行严谨的清理分析及核验,按照严格的学术标准输出新闻连续量化的情感评分,新闻与上市公司连续量化的相关性评分,以及新闻本身的时效性,并将量化分析结果进一步加工为简单、易用的结构化数据,提供给相关研究人员和专业人士使用。
二、试用信息:【访问地址】:【用户名称】:szu
【登录密码】:szu_datago
【试用期限】:至2021331【问题咨询】:郑经理//
三、试用数据库列表:
数据库
数据库简介
试用范围2015-2017
2015-2017
分析自1998年以来由逾1000家海内外报刊媒体刊登的逾
报刊新闻量化舆情数据库1500万篇新闻,输出新闻舆情量化评分、相关公司、与历史新
闻的相似性评分、新闻热度和原创性等指标。分析自2009年以来的200余家核心新闻网站所发布的数百
网络新闻量化舆情数据库万篇网络新闻,输出新闻舆情量化评分、相关公司、与历史新
闻的相似性评分、新闻热度和原创性等指标。
分析2007年以来股吧等专业财经社交媒体的用户评论以及关注和回帖数据,输出包括网贴舆情量化评分以及日均量化舆情统计数据、用户间的关注关系回复关系社交关系图谱等分析结果。
股吧量化舆情数据库
2015-2017
雪球量化舆情数据库
分析了自2011年起,雪球网用户发布在雪球网的内容及该内容的回复。本数据库基于社交媒体用语特点,采用先进的新
词提取算法,挖掘出论坛中使用频率高且具有明显情感倾向性2015-2017的社交用语,并通过业界领先的机器学习和自然语言处理技术,以数百万条的舆情标注数据训练的处理模型,对雪球帖子及评论进行了严谨的清理分析及核验。
关注A股市场1999年以来上市公司高管,尤其是董事长,2015-2016CEOCFO等核心高管的履历信息。特别地,利用本公司自主研
A股上市公司高管社交关
系数据库

发的简历解析引擎,本数据库从高管的文本简历中结构化地抽取构建了他们的工作经历以及教育背景。通过进一步的对单位名称进行归一化以及消除歧义等处理,本数据库构建了高管间的同事和校友关系网络,并据此结合社会网络分析算法量化分析了相关高管在不同社会关系网络中的中心度。而本库也是目前市场上唯一提供上市公司高管社交关系网络量化分析结果的数据库。
上市公司独立董事信息库
输出独立董事基本信息,并解析人物简历文本,提取独立董事本职工作单位信息。
收集整理了包括上证e互动、深交所互动易及全景网三大投资者互动平台的问答数据。针对投资者的提问及上市公司的回答,本数据库输出了问题分类、问题情感、回答质量、回答间隔时间等特色指标。
2015-2016
投资者互动问答数据库2015-2017
本数据库覆盖了逾6000家基金机构(产品)从1998年以来所公开的持股记录,并进一步通过交叉核验股价以及持仓比
上市公司基金持股数据库例等数据。无论是从覆盖的基金机构(产品)数和持股记录数,2015-2017
以及数据质量都远远高于市面上其他类似数据库。例如本数据库所覆盖的基金机构(产品)数高于其他类似数据库约50%本数据库覆盖了在上海证券交易所和深圳证券交易所上市的公司在年报和季报等报告中披露的股份,和股东的构成情况。和市场上相关数据库相比,除了覆盖的记录数有接近50%的提升
上市公司股东股本数据库外,在持股占比等核心字段的缺失率和一致性等数据质量指标2015-2017
上均有显著提升。特别地,本数据库考虑到股东更名的情况,为每个公司的股东赋予了一个唯一ID,帮助学者研究股东持股的变更情况。
包含《新冠疫情基础数据库》和《新冠疫情特色数据库》两个单元:
《新冠疫情基础数据库》:整合全国医院数据、疫情期间全国发热门诊数据、各省经济数据、人口迁移数据等基础信息,可用于研究各省市地区医疗资源分布、疫情对各省市地区的经济影响等。
《新冠疫情特色数据库》整合本公司自主开发的新闻舆情分析数据、专业财经社交媒体分析数据、上市公司参控股公司图谱、网络搜索指数,各地区人口迁移规模指数等特色数据,可以反映疫情对上市公司及不同省市地区的影响程度,或反映不同人群对疫情不同角度的关注程度。
新冠疫情数据库
数据起始日期

2020131
其他待上线数据库
目前正在开发的其他数据库近期陆续上线,届时会以相同的权限自动更新并提示用户试用,包括:
关注投资者关系管理的《投资者调研报告数据库》《网上
——
路演数据库》等;
关注上市公司公告信披的《年报章节文本分析数据库》MD&A语调分析数据库》等


数据访问演示

1、通过上述地址和账号登陆数据平台:

2、以《报刊新闻量化舆情数据库》为例,选择数据库,选择数据表;


3、进入数据表详情页面,自定义选择数据时间及所需的字段,点击下载:



4、查看“下载管理”,下载状态从“待处理”变为“可下载”,即可下载获得数据。


5、在数据表详情页面选择“数据库说明”,点击下载“数据样本及说明”可以获得数据使用手册,有助于理解和使用数据。






Datago新闻及社交媒体量化舆情数据库相关信息

相关推荐