区块链

精准广告背后:谁在偷窥我的隐私

编辑/作者:安安 2019-01-18 我要评论

年关将至,刘明正计划和家人去日本大阪旅游。他的家人通过微信发来一张春秋航空机票的截图,称春秋去大阪可以。8分钟后,一件令他诧异的事情发生了一个微信公众...

  年关将至,刘明正计划和家人去日本大阪旅游。他的家人通过微信发来一张春秋航空机票的截图,称“春秋去大阪可以”。8分钟后,一件令他诧异的事情发生了—一个微信公众号推文的底部广告位出现了大连到大阪的春秋航空机票广告。

  这是一个巧合还是一次精准的广告推送?如果是广告推送,广告商是如何在短短8分钟内,得知用户的操作行为并精准推送广告的?

  和刘明一样,江江也有相同的困惑。前一天,他才在聊天对话里发了某品牌电子琴的淘宝链接,隔天朋友圈广告就给他精准推送了这款电子琴。信息时代,广告无处不在,你我或许都面临过这样的疑惑—明明只是在电商平台上搜索过某样商品,可打开另一款资讯A P P即出现相同的广告,种种贴心推送真的只是巧合吗?

  被一只“壁虎”打断的线上聊天

  与刘明、江江相比,侯先生的广告体验似乎更惊奇些。

  2018年12月10日,他正在手机上和同学聊天,当用安卓手机的搜狗输入法打出“奥迪”两个字,还未点击发送时,手机屏幕里突然闪出一则动画广告。

  广告中,一只灰色的“壁虎”拖着长尾巴从屏幕的左边快速窜出,然后向上冲破“A udi quattro”字样,稍作停驻、张望了一眼而后消失,紧接着奥迪的标语和LO G O渐渐清晰了起来。

  一场私密的对话被一只突然造访的“壁虎”打断,它出现前后不过5秒,却让侯先生许久没缓过神来。“这是根据我输入的信息,读取了我的聊天记录吗?”侯先生称,“太可怕了,感觉自己的隐私被粗暴侵犯了。”

  疑惑、困扰、震惊……或许互联网广告的精准程度带给用户的体验远不仅这些,尤其是当人们的网络行为轨迹和真实生活发生交集互动时,这种“有人比你更懂你”的情绪更为强烈。

  互联网广告“投其所好”、“越来越了解你”的能力正在变得强大,但过程中也产生了隐私争议。人们的不安情绪还来自于,当和朋友线下聊天讨论“西餐厅”、“草莓”、“狗狗玩具”等,A PP马上给你推送西餐相关的广告和资讯。

  此前,曾有外国网友做了一个直播测试,来验证谷歌是否通过麦克风“偷听”用户谈话内容,然后用于广告投放。结果显示,在他反复说了狗狗玩具的话题后,几分钟前才浏览过的网站开始给他推荐这类商品。

  2018年年初,今日头条也曾遭到用户类似的质疑。对此今日头条回应,除非用户点击授权麦克风权限,否则无法收到用户的任何语音信号。用户信息的积累,完全是在严格遵守相关法律规定的前提下,通过用户在今日头条的点击等数据行为产生的。

  有业内人士称,尽管在技术上可行,但收集大量的语音信息,并在短时间内做运算分析,这基本不可能。目前对于声音信息的技术处理,还达不到通过麦克风去获取个人隐私的水平。

  尽管尚有争议,也无确切的证据说明网站或A PP为更精准推送广告而“偷听”用户隐私,但可以肯定的是,包括声纹信息可直接与个人的真实身份联系起来,这些个人生物识别信息一旦泄露或滥用可能危害人身和财产安全,值得警惕。

  茫茫人海找到你,精准广告成爆款背后的推手

  基于用户信息的个性化推荐,在行业内有个统一的名称—程序化广告。所谓程序化广告是指,利用技术手段进行广告交易和管理的一种广告形态,它核心是:在正确的时间和场景通过正确的方式,将正确的商品展示到正确的用户面前。

  事实上,许多产品的爆红背后都能看到精准营销的助力。去年9月中旬,一档刑侦题材的青春电视剧在东方卫视和浙江卫视上星播出,首周收视率不佳,面临撤档风险。对出品方而言,撤档影响的不仅是一部电视剧,还会波及后续的经营业绩。于是,希望扭转颓势的出品方找到了Sandy所在的公司。Sandy是一名从业超过10年的广告人,她和团队很快确定方案:在微信朋友圈和今日头条投放广告。

  在广告市场中,掌握了大量用户数据及其网络行为的大平台,比如腾讯、微博、今日头条,日益受到广告主的青睐。Sandy的经验告诉她,当广告主有明确的短期目标,如新产品或活动上市了,需要冲销量、提升收视率等,或者广告主有了长线的需求时,想要提升品牌消费者黏着度,增加重复购买的可能性,会更倾向于在这些平台投放精准广告。

  然而茫茫人海中,如何精准定向到目标人群呢?

  这首先需要进行用户的识别。据南都记者了解,PC端通常用cookie作为人的唯一标识,为每个“人”打标识的技术在业内被称为“种cookie”,它的主要功能是实现用户个人信息的记录。移动端用的是唯一的设备号ID,W i-Fi上网设备则通过手机无线网卡的M A C地址标识用户。

  基于用户cookie和设备号ID,用户浏览偏好和广告行为被收集和标记,然后打上一个个标签,形成用户画像。

  “这些标签有些是反映用户的静态属性,有些则与用户的动态属性有关,反映他们一定时间内的偏好和需求等,”舜飞科技高级副总裁梁丽丽告诉南都记者。在她撰写的书籍《程序化广告》中提到,标签一般包括用户性别、年龄、行业、收入、婚姻状态、教育背景、兴趣爱好等,这些数据或出自广告投放平台的自有标签,或来自于第三方的数据管理平台。

  结合电视剧题材,Sandy圈定T A (广告行业中的术语,TargetAudience意为目标受众),并总结出对应的标签词,比如男性。在广告投放后台选定好标签词和付费方式后,Sandy和团队上传推广素材,等待一段时间,就可以查看反馈数据,具体的类目包括触达人数、点击率、停留时间、转化率等。

  为了争抢观众,Sandy还将浏览过同期其他热播电视剧资讯的用户也纳入推广范围。“有人在Q Q资料里自称是20岁的少女,但实际上他可能是个猥琐大叔。”Sandy告诉南都记者,“我们都可能在公开场合呈现出一个外在人格,但在网络上浏览了什么、搜索了什么,是没法骗人的。”

  “触达用户是基础。有了大量的触达基数,才能接触到可能感兴趣的人。下一步就是针对非常感兴趣的人,做进一步的优化。”Sandy回忆,为了匹配用户的兴趣,团队制作了多套推广素材。以今日头条为例,不同的T A用户可能在新闻信息流中看到亲情、爱情、兄弟情等不同主题的片花广告。

  两周的投放收效明显,该剧的收视率很快冲进全国前三,并保持稳定。

  淘宝真的会和京东共享我们的标签吗?

  不久前,一篇《大数据之下无隐私》的微信文章在朋友圈刷屏,作者肥肥猫提到在淘宝和京东分别搜过一样特别小众的商品,结果打开拼多多首页推荐的就是同款产品。

  究竟拼多多是如何拿到其淘宝京东的搜索偏好的?是平台之间共享数据,还是内鬼兜售、数据库被黑,抑或是手机厂商搞鬼?肥肥猫称,“百思不得其解,细思极恐。”

  用户在京东和淘宝上的搜索记录为何会在拼多多上被推荐同款?

  据南都记者了解,程序化广告存在一个类似股票交易的市场,广告的买卖双方都在这里对接。从你打开一个网页开始,到那则让人觉得似曾相识的广告出现眼前,背后其实有个“实时竞价”(RT B)的过程。

  目前市面上常见的广告交易平台(A D X )分为“公共综合”和“私有”两类:前者不拥有媒体资源,只承担撮合买卖双方的角色,比如百度的B E S、阿里的T A N X、360的M A X等;后者则从属于主要的媒体方,既有流量又可提供交易平台,比如腾讯社交广告(原名广点通),新浪、搜狐等门户类媒体A D X,或优酷、爱奇艺等视频类媒体的A D X等。

  根据广告交易市场的不同,R T B实时竞价也有公开和私有之分。相比之下,公开的A D X的流量较大,但质量参差不齐,而私有A D X的流量较为优质,当然价格也较贵,并且它们更愿意将流量开放给大型的广告主,于是产生了私有竞价。

  需要指出的是,不管是何种交易模式,平台间的数据并未打通。

  “在交易市场上并没有用户的标签信息被交换或共享,商家相互传递的只是一个需求,就像股票交易市场。例如钢琴商想投放广告,他可能会找到微信、淘宝、拼多多或任意一家平台投放钢琴广告,这些平台会根据自己曾经打上过"钢琴"标签的用户来向他们推送这则广告,数据还是属于各个平台自己”,一直从事程序化广告研究的资深专家吴俊告诉南都记者。

  法律边界:广告推送给机器可以,推送给人越界

  相较于无差别的广撒网投放,程序化广告更能在合适的场景抵达目标客户群,从而提升广告的效率。不过对用户而言,这样“很懂你”的贴心服务或许见仁见智。

  “如果推荐给我的广告正是我想买的商品,正好省去了我搜索的时间,”熟知广告投放逻辑的梁丽丽说,“但如果在我买过空调后,还一直推送空调广告,就有些困扰了。”

  一个更为重要的问题是,这种越发精准的收集和推送行为是否会侵犯用户隐私,并触碰了法律的边界?

  搜狗的相关负责人告诉南都记者,搜狗输入法中的“智能分享”推荐功能,通过用户设备终端进行计算匹配实现。用户在使用键盘过程中输入的文字内容、个人敏感信息,不会被使用或上传到云端。为保护用户隐私,搜狗采用符合业界标准的安全防护手段,整个数据在传输和存储过程中都是加密的状态。

  腾讯方面在此前的公开声明中也表示,微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上,不会将用户的任何聊天内容用于大数据分析。

  根据《网络安全法》的规定,网络运营者不得泄露、篡改、毁损其收集的个人信息,未经被收集者同意,网络运营者不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。

  2017年5月开始实施的《个人信息安全规范》中要求,使用个人信息时应消除明确身份指向性,避免精确定位到特定个人。

  可以认为,对于个人信息的收集、使用的法律边界,在于不能精确定位到特定的个人,在于不识别出一个人的身份。这也是目前程序化广告的推广边界—一个由标签组成的用户画像是否能和一个可识别的真实个人联系起来。

  据相关研究者介绍,为了避免用户画像与真实个人对应,所有的标签都会被打到一个手机设备ID上,而非手机号码或者身份证等能够识别真人的ID.

  换句话说,如果过程合规,所有的广告都是推送给一个个手机而非具体的人。“对于我们来说,手机背后是张三李四根本不重要,我们关心的只是这台手机的主人是喜欢化妆品还是运动鞋”,一个大型网站的工作人员表示。

  此外,手机厂商在保护用户隐私中承担着重要的责任。iO S手机中,一般用ID FA码来作为广告推送的ID,用户可以随时关闭或清空苹果手机中的IDFA码,决定是否被追踪。A ndroid目前则还是以IM EI为主,要获取这个设备号,A PP需要向用户申请“REA D_P H O N E _S T A T E”权限。在A ndroid6.0版本之前,这项权限通常默认开启,后来随着版本的升级,用户也可以选择关闭。

  基于此,我们似乎可以初步建立这样一个判断的方法:当广告是规范地推送给我们的手机识别码或ID,可看做是在法律法规规范内的大数据运用,这也是目前国内外互联网重要的盈利方式之一;但当广告推送给的是我们真实的人,就已经跨过了法律法规的界限。

  争议:识别用户画像背后真实个人并非难事

  不难理解,精准营销的本质在于定向性,当用户画像越全面,广告投放的精准程度也越高,但一个不可回避的问题是—“通过信息集勾勒网络环境背后真实的用户个人并非难事。”

  长期关注大数据法治研究的学者齐爱民告诉南都记者,为了尽可能提升广告投放的精准性,广告投放主体通过加入广告联盟等方式,最大程度上获取用户数据。即便精准广告的投放以契合用户兴趣,深入挖掘用户潜在消费力为目的,但这并不妨碍对用户地址、联系方式等敏感个人信息的收集。

  大数据可以帮助广告主利用海量数据进行用户行为分析,提高广告投放效果,但使用不当则有可能涉及用户隐私安全问题。

  有时候,你走在逛商场不小心连上一个Wi-Fi,广告主可能就知道你的很多秘密。此前有网友爆料,Wi-Fi探针可扫描获取到周边设备的M A C地址,进而匹配到手机号、浏览记录和大体的家庭关系。

  目前这种以W i-Fi探针技术为基准衍生出的广告营销已成产业链。一名网络安全专家向南都记者解释了背后的技术原理,Wi- F i探针好比将设备对应到人、人对应到数据的桥梁。它只能识别用户所在区域的M A C地址,但通过与第三方数据相融合,比如支付数据、会员数据、线上数据、地理位置等,可分析出详细的用户画像,进而进行精准的广告推送。

  2018年8月,浙江绍兴警方破获一起非法窃取30亿条个人信息的案件。涉事的北京瑞智华胜是一家专注互联网营销业务公司。据办案民警介绍,通过与正规运营商合作、拿到登录凭证,该公司将一些非法软件置入自动采集用户cookie、手机号等信息,然后用于精准营销。

  2018年11月,科技类媒体“品玩”曾报道,有企业正在研发一种智能摄像头和软件系统,可以记录客人每次经过门店的时间点、照片、心情、有无戴眼镜以及系统推测的年龄和种族。每当有客人到店,人脸识别技术会自动对比会员信息库,识别出新老用户,提醒店员精准接待。

  在商家看来,这套只需3000多元就能买来的系统无疑是贴心的营销工具,但对消费者来说,很可能在毫无察觉的情况下,就把个人隐私袒露在商家面前。

  “说到底精准营销不过是利用大数据技术实现的商业行为。”齐爱民告诉南都记者,不管是针对手机ID亦或是推送到真实的人,精准营销行为都涉及对个人信息的收集和使用,因此应当适用于网络服务提供者与用户之间关于个人信息保护和利用规则体系。

  互联网发展至今,大数据毫无疑问已成为行业最庞大最有价值的资产,流动与使用,则是大数据实现价值的重要方式。是否能兼顾数据流动与个人隐私间的平衡,已成为业界发展最大的挑战。

文章来源:南方都市报

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。4、对于网友投稿的文章请仔细核对其真实性,如遇要求汇款转账情况,请格外谨慎。

相关文章
  • 传统巨头抢占区块链场景高地 医疗、汽车、金融

    传统巨头抢占区块链场景高地 医疗、汽车、金融

  • 网络时代,区块链技术为你我个人信息安全保驾

    网络时代,区块链技术为你我个人信息安全保驾

  • 创新链接未来,安全赋能发展——区块链技术网

    创新链接未来,安全赋能发展——区块链技术网

  • 央行范一飞:利用5G打造金融服务新模式 深挖区

    央行范一飞:利用5G打造金融服务新模式 深挖区