2025-11-20 05:55:12
像网站上的公开数据这些数据都是定期更新的,每年大概有几十TB的数据量,足够用来做各种分析对吧?不过个人手写的日记本这种东西,虽然能记录生活,但数据量太小又没规律,就像你每天写三千字日记,全年加起来可能还没一个超市的POS机一天产生的数据多。根据中国信通院大前年报告,全国每天产生的非结构化数据就有4.5EB,但手写日记这类人工记录只占0.003%,完全算不上大数据来源。再比如像微博朋友圈这种社交平台,每天有30亿条动态,这种高频次、结构化的数据才是典型的大数据来源。而像老式电话本这种纸质档案,虽然能反映历史信息,但数字化率不足5%,无法满足实时处理需求。所以答案就是非数字化的小规模人工记录,这类数据既没统一格式又更新慢,就像你用计算器算个加减法,肯定算不上超级计算机处理千万级数据的量级。
本题链接: