之前就有过这个想法,但是只进行了前半部分的实验,也就是将所有的带标签的数据增强后数据和不带标签的数据混合聚类,后面的想法是这样的,混合聚类后,将每一个带标签的图像指向的簇放置一个和图像一样的标签,最后将相同标签的簇合并在一起,然后再训练一个模型,当做一个教师模型,最后利用这个教师模型对之前的每一个簇利用投票的方法都设置上标签,然后将相同标签的簇融合再去训练学生模型。这个学生模型就是最后的模型。当然中间肯定还会有些问题,这种方法的优点是不用考虑二值化和相似度检测的问题,直接使用彩色图像进行聚类即可,但是缺点是最后的训练数据可能会包含大量的噪音。