按键行为识别技术作为生物识别技术的一种,有必要先介绍下生物识别技术。
一、生物识别技术概述
所谓生物识别技术,就是通过计算机与光学、声学、生物传感器和机器学习等高科技手段密切结合,利用人体固有的生理特性(如指纹、人脸、虹膜、掌纹等)和行为特征(如声音、按键行为、笔迹等)来进行个人身份的鉴定。
图1 典型生物识别技术
由于人体特征具有人体所固有的不可复制的唯一性,这一生物密钥无法复制,失窃或被遗忘,利用生物识别技术进行身份认定,安全、可靠、准确。而常见的口令、IC卡、条纹码、磁卡或钥匙则存在着丢失、遗忘、复制及被盗用诸多不利因素。生物识别技术可广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务。在当今互联网时代,个人信息经常遭到泄露,如最近的12306用户信息泄露事件,个人信息安全到了人人担忧的地步,生物识别技术有望改变这一局面。
本文对实际项目中研究的按键行为识别技术做一简单介绍,主要介绍其背后原理以及应用场景等。
二、按键行为识别原理
2.1 起源
在1844年5月24日,消息“上帝创造了何等的奇迹”通过美国华盛顿发送到马里兰州巴尔的摩的巴尔的摩和俄亥俄州铁路的“外仓库”,一个长距离通信的时代开启了。到1860年代,电报革命如火如荼地开展起来,与此同时,电报员是一个非常珍贵的资源。根据经验,每一个电报员都开发了他们独特的“签名”,并且能够简单地通过他们的打字节奏辨别出来。
到了二次大战,军队通过摩斯密码来传递消息。使用一个叫做“发送方的拳头”的方法,军事情报机构发现个人具有独特的方式来键入消息中的“点”和“虚线”,以便创建能够帮助区分敌我的节奏信息。
2.2 基本原理
按键行为识别技术主要是利用个人在键盘上打字的方式或节奏具有唯一性这一行为特征,结合机器学习技术进行的一项生物识别技术。
通常,记录一个打字会话时所有保留下来的是对应于哪个按键被按下的打字顺序的字符序列,但时间信息是抛弃的。当阅读邮件时,接受者无法从阅读短语“I saw 3 zebras !”中获得这些信息:
1) 这些字符是快速还是慢速打出来的?
2)发送者在将"i"转换成大写字母“I”时,是使用左边的shift键、右边的shift键还是"Caps-lock"键呢?
3)在字母"z"或数值"3"之前,当你寻找这些字母时,所有字符是以同样的速度打出来的,还是中间有个较长的停顿呢?
4)发送者初始错误地敲入任何字母、然后返回修改它们,还是他一次就全都正确地打印出来呢?
研究人员对这种常被忽视的按键行为信息非常感兴趣,尝试利用这种信息来验证按键人的身份。这通常是可能的,因为一些按键产生的特色是与手写或签名一样具有唯一性。这种被抛弃的时间信息隐藏的正是一个人的按键节奏,可以通过从键盘上获得用户的原始按键时间数据,结合机器学习技术来建模获得。通过测量一个人的按键节奏来生成该使用者独特的生物学模板,供验证和识别使用。该过程具有隐蔽性,以搜集用户无意识状态下的按键节奏。
2.3 主要技术
按键行为识别中用到的主要技术包括特征提取与识别或验证两方面。
特征提取,即从用户的原始按键数据(按键被按下和释放的时间)中提取有效的特征来表征该用户的身份,所用方法主要是提取有效稳定的统计特征,常见方法如图2所示。
图2 按键行为特征提取方法
识别,即一对多问题,从特征数据库中检索某一用户特征的身份,返回识别对象的身份信息;验证,即一对一问题,从特征数据库中取出待比对的用户参考特征,与实际上传的查询特征进行比对,返回结果为Yes或No;识别或验证主要应用机器学习或模式识别方法(如逻辑回归、SVM等),常见方法如图3所示。
图3 按键行为识别中常用的模式识别方法
2.4 系统方案
我们所实现的系统方案主要分客户端与服务端两方面:客户端负责采集用户的按键时间信息,并进行预处理、行为特征的计算与上传等,如图4所示;服务端获得用户的行为特征数据后,将其与特征库做比较(识别采用检索;验证采用一对一比对),最后得到识别(一对多)或验证(一对一)结果。
图4 客户端
图5 服务端
2.5 实验性能
在游戏场景下的实际测试表明,在约700人的实际测试集上,结合聊天和游戏两种按键数据,验证的等错误率只有2.5%左右(正确识别成错误的概率、错误识别成正确的概率,这两种错误率相等时的概率称为等错误率),识别性能效果优良。
三、应用场景
按键行为识别具有隐蔽性高、识别效果好、成本低(只有键盘)等优点,可广泛应用于依赖键盘输入的身份验证场景,如教育方面的上机考试、电子邮件身份验证、游戏玩家的实时身份监控以及网络写手身份验证等场合。
四、总结
本文对生物识别领域的按键行为识别技术做了简单介绍,方便大家了解背后的原理与相关技术。目前,我们组在按键行为识别技术上已有一定的积累,并在实际数据集上取得优异的识别性能。可进一步应用在教育考试、游戏身份认证、电子邮件安全等需要鉴别用户身份的场合。
参考资料
[1] Developing a Dynamic Free Text Keystroke Biometrics System. 2013
[2] Biometric personal authentication using keystroke dynamics: A review. 2011.
[3] An Investigation of Keystroke and Stylometry Traits for Authenticating Online Test Takers. 2011.
[4] Comparing Anomaly-Detection Algorithms for Keystroke Dynamics. 2009.
[5] http://en.wikipedia.org/wiki/Keystroke_dynamics.
网易云新用户大礼包:https://www.163yun.com/gift
本文来自网易实践者社区,经作者胡光龙授权发布。