访谈|关于数据采集:你需要了解这些( 三 )


【 访谈|关于数据采集:你需要了解这些】线下采集数据的方式有很多种,例如:问卷调查,用户访谈,实地调研,焦点小组,用户反馈等等,接下来选取几个常用的方式进行介绍。
1)问卷调查
问卷调查是目前广泛采用的调查形式,根据调研目的设计问卷,并采用抽样方式确定调查样本,完成调查。问卷调查的步骤一般为:确定用户及样本量(根据调查目标选择符合特征的用户,尽可能多的涵盖符合目标的各类人群)——设计调查问卷框架——发放问卷(试调研/正式调研)——汇总数据,撰写报告
访谈|关于数据采集:你需要了解这些
文章插图
2)用户访谈
用户访谈是用户研究中非常常用的一种方式,运用有目的,有计划,有方法的口头交谈向用户了解事实的方法。一般用户访谈的步骤为:确定调研的目标与内容——确定用户和样本——确定访谈与提纲——进行访谈——汇总报告
三、采集数据类别当我们通过上述方式采集数据后,获取的数据一般有三种类型,即结构化数据,非结构化数据,半结构化数据。关于结构化与非结构化数据,我们在上文《10分钟带你了解数据库、数据仓库、数据湖、数据中台的区别与联系(二)》提过,大家有兴趣可以点击查看。
那么何为半结构化数据呢?
半结构化数据,顾名思义就是介于结构化数据(关系型数据库)和非结构化数据(声音,视频)之间的数据。半结构化数据是结构化数据的一种形式,它并不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。下图所示就是JSON简单实例,我们可以观察发现其存储这某些书籍信息,一般日志文件,XML文档,JSON文档等就是半结构化数据。
访谈|关于数据采集:你需要了解这些
文章插图
四、小结本文带领大家快速了解各类数据采集方式,各类采集技术固然重要,但要结合所在行业,所在企业规模情况进行选取,减少“杀鸡焉用牛刀”的情况出现。
随着国家安全重要性及居民个人隐私观念的提升,在保证数据采集的精确性的同时,更应注意数据采集中如何保护用户隐私问题的情况以及涉及到国家关键基础设施相关数据的安全性。
笔者在写这篇文章时,朋友正好像我推送微信公众号的一片关于Flightradar24涉及信息安全违规下架的文章,笔者与朋友对无线电以及AIS系统较为感兴趣,深知此类数据的重要性。
本篇文章就写到这里,关于数据分析,数据产品相关的知识笔者会继续与大家分享交流,文中不准确的地方欢迎并希望大家批评指正。
本文由 @快乐的给予 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Pexels,基于 CC0 协议

推荐阅读