接触式读票机(Contact-based)
原理:通过物理接触(如金属触点)检测选票上的导电标记(如特殊墨水填涂),形成电路导通来识别选择。
特点:
识别速度快,但对选票材质和标记墨水要求高。
易受污渍、折叠影响,应用场景较窄。
标记区域定位:锁定选票上的有效选择区
模板匹配:读票机内置选票格式模板,通过检测预设的定位点(如角点、条形码)确定候选人选项框、政党符号等区域的坐标范围。
兴趣区域(ROI)划分:将选票图像分割为多个独立 ROI(如每个候选人对应一个矩形区域),减少全局分析的计算量。
示例:美国大选使用的 “蝶形选票”(Butterfly Ballot)中,读票机通过模板定位左右两列候选人姓名旁的填涂框,避免因选民误填相邻区域导致误判。
典型技术挑战与解决方案
挑战场景 技术应对措施
不同墨水的反光差异 - 采用多光谱光源(如红光 + 红外光),针对不同墨水(铅笔、蓝黑墨水、荧光笔)调整检测波长。
- 机器学习模型训练:用历史数据训练分类器,区分不同墨水材质的标记。
选票折叠或污渍干扰 - 图像修复算法:通过插值法填充折叠造成的图像缺失区域。
- 污渍识别模型:用深度学习区分 “人为标记” 与 “自然污渍”(如咖啡渍形状通常更不规则)。
非标准填涂(如超框、轻描) - 弹性阈值设定:根据填涂中心位置,允许标记超出框线一定范围(如框线外 5 像素内仍算有效)。
- 概率化判定:结合填涂位置、面积、浓度等多维度特征,给出 “有效概率”(如 80% 概率为有效标记),而非非黑即白的判断。
选票格式变更(如新版选票) - 动态模板配置:允许管理员导入新选票模板,自动更新 ROI 区域坐标与标记规则,无需修改底层算法。
软件算法:从识别精度到防篡改机制
1. 多重校验算法架构
重复扫描比对:对每张选票进行至少 2 次独立扫描(间隔 50ms),比对两次图像的像素差异,若标记区域灰度值偏差超过 15%,则触发第三次扫描并人工介入(如日本选举法要求对争议票进行三次扫描)。
多特征融合判断:结合填涂面积、边缘轮廓、灰度梯度等多维度特征,采用加权投票机制(如面积占比权重 40%+ 边缘匹配度权重 30%+ 浓度均匀性权重 30%),避免单一特征误判(例:某区域面积达标但边缘锯齿状,可能被判为 “无意涂抹”)。
机器学习模型迭代:利用历史选举的有效 / 无效票数据(如美国 EAC 公开的选票数据集)训练 CNN 模型,对非标准标记(如超框填涂、轻描标记)的识别准确率提升至 99.2% 以上。
2. 防篡改与数据完整性保护
哈希值校验:对每张选票的扫描图像生成哈希值(如 SHA-256),存储于区块链节点或加密数据库,任何图像修改都会导致哈希值变更,可实时检测数据篡改(如德国部分州采用区块链存证选票图像)。
软件版本控制:读票机操作系统与识别算法采用签名固件更新机制,仅允许通过官方渠道推送的版本(附带数字证书)安装,防止恶意程序植入(如 2018 年美国佛罗里达州选举前,对所有读票机进行固件哈希值比对,拦截 3 台异常设备)。