拓尔思获10家机构调研:目前公司积累了1300亿条基础数据,日均增加1亿条(附调研问答)

2023-03-13 10:47:55 来源: 同花顺综合

  拓尔思300229)3月10日发布投资者关系活动记录表,公司于2023年3月10日接受10家机构单位调研,机构类型为保险公司、其他、基金公司、证券公司、阳光私募机构。

  投资者关系活动主要内容介绍:

  一、副总经理、董事会秘书李党生先生就公司主营业务、核心产品及优势、未来战略规划进行介绍。

  二、参会机构提问及回答。

  问:在数据要素市场发展势头强劲的大背景下,请问拓尔思有哪些发展规划?

  答:拓尔思在经营过程中形成了一套1+1=N的数据要素商业模式。

  “1+1”是指一个大数据底座和一个人工智能技术平台。“N”是指行业SaaS服务集群,未来可实现N个云服务产品的拓展。

  “1+1=N”的商业模式主要依托拓尔思自建的大数据中心,基于自研的大数据底座和人工智能技术平台,面向优势行业的业务应用,根据不同场景封装产品,基于公司成熟营销体系迅速推向市场。这种模式充分体现了拓尔思的数据要素具有可复制性强、迭代速度快、复用价值高以及无限供给等特点,实现了统一数据在产品化方面的裂变增长。

  目前,拓尔思拥有完整的大数据基础建设产品线、丰富的行业SaaS服务集群和可靠的安全一体化平台。公司将以完善自身数据要素资源体系、壮大数据要素应用体系及建立数据要素安全体系为发展目标,从资源、应用、安全三个方面全面布局数据要素市场。

  基于对1300亿以上资源性数据资产,通用、行业/领域知识库大类30余种,以及350种以上深度学习算法模型的融合治理,公司目前已形成了产业大脑、媒体资讯、网络舆情三大数据资产平台,为公司在网络信息内容治理、金融监管、政务资讯服务、金融机构风控管理、智能媒体服务、开源情报等领域的云和数据服务提供数智赋能。

  问:公司积累了海量数据资产,请问这些数据来源于哪里?

  答:目前公司积累了1300亿条基础数据,日均增加1亿条,以上数据全部来源于互联网公开数据。拓尔思数据中心目前拥有3大专业IDC机房,上千台高端机架式服务器完成对互联网公开数据的7*24小时不间断采集,同时租用了阿里云及微软云的服务器实现全球数据采集。数据中心监测的采集站点包括80万余家新闻网站、3000余个资讯APP、1200余家国内报刊、20余个第三方平台、79语种50万余个其他站点。每日数据量高达1亿多条,几乎涵盖了全量的微博新增数据,网站覆盖度及数据存储量均明显高于业内水平。

  问:公司积累了丰富的数据处理经验,请问将服务客户积累的数据用于变现是否存在数据纠纷风险?

  答:拓尔思基于自然语言处理技术、积累的各场景行业术语及主题数据形成的各行业知识图谱,对海量多源异构数据进行融合、关联、标注以及知识化处理,构建形成大规模领域知识图谱。目前,公司拥有通用、行业/领域知识库30+大类,标签规则30000+。每类知识库具有规模大、语义关系丰富、结构友好、质量精良等特点。公司向客户提供的是以自然语言处理技术为核心的软件产品和数据中台产品,并不接触客户的内部数据,因此不存在数据纠纷风险,且从未产生数据纠纷。

  问:请问公司的数据采集方式是自动采集还是人工采集?

  答:拓尔思大数据中心的数据是基于自研的互联网数据采集系统实现全网数据全自动采集的。早在2002年,拓尔思就推出了第一代网络信息采集系统——TRS网络信息雷达,已成功应用于数千家媒体、企业、金融和政府部门的数据中心或信息中心。2020年,拓尔思推出了TRS海蜘大数据采集平台(以下简称“海蜘”)。海蜘是一款专业的网络数据深度采集产品,具有智能采集、全网适用、简单易用、高效稳定的特点,可提供多种网页采集策略与配套资源,帮助整个采集过程实现数据的完整性与稳定性。“海蜘”根据互联网不同的数据类型与网站结构,采用分布式抓取技术,对指定网站定向数据采集、存储,然后进行分类、分词、查重、打标等数据加工,在专业知识库建立、企业竞争情报分析、报社媒体资讯获取、舆情监测等领域应用广泛。同时,公司掌握高质量、具有公信力背书的数据采集点,在数据的质量和行业关联度方面具备优势。

  问:请问公司在数据标注方面是人工标注还是机器辅助?

  答:在大数据领域,目前多数公司在数据处理方面以人工为主。

  拓尔思作为以自然语言处理为核心技术的公司,公司核心技术的对内优势主要体现为提升数据处理效率。公司利用深度模型和算法已成功打造多款数据中台,大力拓展数据治理和自动化清洗功能,以机器代替人工的方式实现数据自动打标,已累计智能标签模型120类,共计2800余个。

  目前公司采取机器+人工的数据标注方式,且机器标注率已经达到80%,降本增效成果明显;

  拓尔思信息技术股份有限公司主要业务是向各级党政机关和各类企事业单位等机构客户提供由公司自主研发的人工智能和大数据工具软件平台、相关行业应用系统和解决方案、云和数据智能服务(SaaS/DaaS)、及信息安全产品和解决方案等多种产品服务组合。公司主要产品为软件产品、安全产品、技术服务、云和数据服务、媒介代理、房产。自成立以来,承担过包括国家863计划、重大科技计划、信息安全专项、核高基专项等几十项国家级项目。公司连续十多年稳居国家规划布局内重点软件企业之列,多年被评为中国自主可靠企业核心软件品牌,同时也获得CMMI-5级认证。公司的技术或产品曾获国家科技进步二等奖。

  调研参与机构详情如下:

参与单位名称参与单位类别参与人员姓名
万家基金基金公司况晓、刘洋、武玉迪、汪洋、耿嘉洲、胡文超、郎彬、陈飞达
鑫元基金基金公司龙凌波
东方证券证券公司宋鑫宇、浦俊懿、谢忱
兴业证券证券公司唐梓娟、杨本鸿、桂杨
申万宏源证券自营证券公司杨晓彤
银河证券证券公司吴砚靖、赵巧敏
建信基金阳光私募机构刘洋、孙晟、左远明、张文浩、张湘龙、徐文琪、李登虎、程广飞、邱宇航、黄子凌
人保资产保险公司李京洋
本炎投资其他李刚
银河创新资本其他肖挺

关注同花顺财经(ths518),获取更多机会

0

+1
  • 浩丰科技
  • 天和防务
  • 科大国创
  • 吉大正元
  • 国盛金控
  • 格尔软件
  • 川大智胜
  • 奥维通信
  • 代码|股票名称 最新 涨跌幅