我想做一些能够识别屏幕上不同对象的东西。 假设我用文字字段、 标签和按钮在窗口上截取一个截图。 我想通过图像, 它应该能够区分一个和另一个。 换句话说, 它应该将名称文本字段放在文本字段所在位置的顶部, 按钮顶部的按钮和标签顶部的标签上 。
以下是互联网上的样本图像, 以可视化注册窗口 : http://kb.parallels.com/Attachments/128288/Imags/registration1.jpg
我想在爪哇这样做,但我不确定这是否可行。有人知道我应该在哪里开始寻找吗? 边缘检测? 特征检测? OCR/ICR?
这已经存在了吗?
有人能指引我到正确的方向吗?
谢谢!