AMiner是具有完全自主知识产权的科技大数据挖掘与智能服务平台AMiner。
Aminer最厉害的功能还是在于找某个领域的牛人。
AMiner平台以科研人员、科技文献、学术活动三大类数据为基础,构建三者之间的关联关系,深入分析挖掘,面向全球科研机构、科技企业及学者,提供学者及论文文献等学术信息资源检索,以及专业知识服务。
AMiner(aminer.org)旨在为研究人员社交网络提供全面的搜索和挖掘服务。在该系统着重于:(1)通过从分布式Web提取信息为每个研究人员创建基于语义的配置文件; (2)整合来自多个来源的学术数据(例如书目数据和研究者档案); (3)准确搜索异构网络; (4)从建立的研究人员社交网络中分析和发现有趣的模式。 AMiner中的主要搜索和分析功能包括:
资料搜索:输入研究人员的姓名(例如,唐杰),系统将返回使用信息提取技术为研究人员创建的基于语义的资料。在个人资料页面中,提取和整合的信息包括:联系信息,照片,引文统计,学术成就评估,(时间)研究兴趣,教育历史,个人社交图谱,研究经费(目前仅美国和加拿大)以及出版记录(包括引文信息,并且论文会自动分配到几个不同的领域)。
专家发现:输入查询(例如数据挖掘),系统将返回有关此主题的专家。此外,系统还将建议有关该主题的顶级会议和排名最高的论文。有两种排名算法,VSM和ACT。前者类似于常规语言模型,而后者则基于我们的作者会议主题(ACT)模型。用户还可以提供对搜索结果的反馈。
会议分析:输入会议名称(例如KDD),系统返回该会议上最活跃的研究人员和排名最高的论文。
课程搜索:输入查询(例如数据挖掘),系统会告诉您谁在教与该查询相关的课程。
子图搜索:输入查询(例如,数据挖掘),系统首先告诉您与该查询相关的主题(例如,五个主题“数据挖掘”,“ XML数据”,“数据挖掘/查询处理”, “ Web数据/数据库设计”,“ Web挖掘”是相关的),然后显示在每个相关主题上发现的最重要的子图,并在子图的摘要中进行扩充。
主题浏览器:基于我们的作者会议主题(ACT)模型,我们自动从出版物中发现200个热门主题。对于每个主题,我们都会自动分配一个标签来表示其含义。此外,浏览器还提供了最活跃的研究人员,最相关的会议/论文,并发现了该主题的发展趋势。
学术排名:我们定义了8条评估研究人员成就的方法。这些度量包括“ h指数”,“引文”,“上升趋势”,“活动”,“寿命”,“多样性”,“社交性”,“新星”。对于每种量度,我们在不同的域中输出排名列表。例如,可以搜索“数据挖掘”域中引用次数最高的人。
用户管理:可以注册为用户,以:(1)修改提取的配置文件信息; (2)提供有关搜索结果的反馈; (3)关注AMiner的研究人员; (4)创建一个AMiner页面(可用于广告conf /车间,或招募学生)。
AMiner.org已经在互联网上运营了三年多。目前,该学术网络包括6,000多个会议,320万种出版物,700,000个研究者档案。该系统吸引了来自200多个国家/地区的用户,每天接收超过200,000个访问日志。用户来自前五名的国家是美国,中国,德国,印度和英国。