想问一下关于神经网络的一些问题,可否有大佬解答一下?
-
- 有没有现成的字母识别的模型(如官方教程中提供了数字识别的模型,包括tflite文件和labels文件,可以直接用于识别数字)。
- 如果没有现成可用的模型,要想识别A-H共8个字母,请问每个字母各取几张图片比较合适呢。根据我自己在edgeimpulse的训练结果,A-E每个字母取40张图片时正确率约为90%,仅识别A和B两个字母时各取80张图片,正确率约为98%。
- 用训练好的模型检测时,字母在视野中的大小是否会对识别结果产生影响。根据我的测试结果,仅识别A和B两个字母时,当字母远离摄像头时,A会被识别为B。这是否与字母笔画的粗细有关?
-
https://github.com/SingTown/openmv_tensorflow_training_scripts/blob/main/mnist/openmv_mnist.ipynb
这里是训练出mnsit的代码,你可以改为字母分类,比如emnist数据集,好像是14万个图片。
-
您好,我是openmv新手,不具备充足的基础知识,因此未能完全理解您的意思。是只要打开这个链接、把代码复制到pycharm里面、然后把所有的mnist都改为emnist并运行、即可得到字母识别的tflite文件了吗?我看代码中并没有生成labels.txt文件,所以我的理解可能是错误的,恳请指点,感谢。
-
@kidswong999 您好,我是openmv新手,不具备充足的基础知识,因此未能完全理解您的意思。是只要打开这个链接、把代码复制到pycharm里面、然后把所有的mnist都改为emnist并运行、即可得到字母识别的tflite文件了吗?我看代码中并没有生成labels.txt文件,所以我的理解可能是错误的,恳请指点,感谢。
-
@hbgi 分类手写字母和分类实际的猫狗还是不一样的,因为数据量很大。不可能几句话给你说清楚。花个几个月也很正常。