光学扫描式读票机(Optical Scan)
原理:通过光学传感器扫描选票上的标记(如铅笔填涂、墨水笔勾选),利用图像识别技术判断选民选择。
特点:
成本较低,兼容纸质选票,适合大规模选举。
需选票格式标准化(如固定位置的填涂框)。
应用场景:美国大选、印度议会选举等大规模纸质选票选举。
条形码 / 二维码读票机
原理:选民通过填写或扫描条形码 / 二维码选票,机器读取编码后解析投票信息。
特点:
数据精度高,可存储更多信息(如选区、候选人编号)。
需提前印制带编码的选票,适合电子化程度较高的选举。
特征提取与判断:识别选民的选择意图
根据选票标记类型(填涂、勾选、手写符号等),算法采用不同的特征提取策略:
(1)填涂标记识别(常见场景)
面积占比法:计算填涂框内黑色像素占比,超过阈值(如 30%-50%)则判定为有效选择。
例:选民使用 2B 铅笔填涂候选人 A 的方框,扫描后该区域黑色像素占比达 45%,算法判定为有效投票。
边缘检测法:通过 Canny 或 Sobel 算子检测填涂区域的边缘轮廓,与标准填涂形状(如矩形、圆形)比对,排除不规则标记(如笔尖打滑形成的短线)。
浓度梯度分析:填涂越均匀的区域,灰度值分布越集中,算法可通过统计像素灰度方差来区分 “认真填涂” 与 “轻微触碰”。
(2)勾选或手写符号识别
形态学分析:通过膨胀、腐蚀等形态学运算,将勾选符号(√)或手写标记(如 “○”)转换为标准形状,再与预设模板匹配。
方向特征提取:对于斜线标记(如 “/”),计算像素分布的梯度方向,判断是否符合 “勾选” 的典型角度(如 45° 或 135°)。
(3)异常标记检测
多选判定:同一候选区域内检测到多个标记(如同时填涂两个候选人框),或单票标记数超过规定(如总统选举多选 1 人),则判定为无效票。
空白票识别:所有候选区域标记面积均低于阈值,判定为未投票。
4. 结果验证与输出:确保计数准确性
重复校验:对关键标记区域进行多次扫描(如两次独立图像采集),结果一致才确认有效。
人工复核接口:对算法判定存疑的选票(如填涂面积接近阈值、标记形状模糊),生成图像供选举工作人员人工审核(如美国部分州要求对 “争议票” 进行人工查验)。
数据输出:将识别结果转换为结构化数据(如候选人 ID、得票数),同步至中央数据库或打印纸质统计表。
典型技术挑战与解决方案
挑战场景 技术应对措施
不同墨水的反光差异 - 采用多光谱光源(如红光 + 红外光),针对不同墨水(铅笔、蓝黑墨水、荧光笔)调整检测波长。
- 机器学习模型训练:用历史数据训练分类器,区分不同墨水材质的标记。
选票折叠或污渍干扰 - 图像修复算法:通过插值法填充折叠造成的图像缺失区域。
- 污渍识别模型:用深度学习区分 “人为标记” 与 “自然污渍”(如咖啡渍形状通常更不规则)。
非标准填涂(如超框、轻描) - 弹性阈值设定:根据填涂中心位置,允许标记超出框线一定范围(如框线外 5 像素内仍算有效)。
- 概率化判定:结合填涂位置、面积、浓度等多维度特征,给出 “有效概率”(如 80% 概率为有效标记),而非非黑即白的判断。
选票格式变更(如新版选票) - 动态模板配置:允许管理员导入新选票模板,自动更新 ROI 区域坐标与标记规则,无需修改底层算法。