白癜风治疗的较好办法 http://m.39.net/pf/a_4578332.html
一、赛题简介
图像分类是根据图像的视觉信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。图像分类在很多领域有广泛应用,包括交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
由图像分类更进一步,图像标签是通过为图像分配正确合适的标签,将图像的视觉信息转换为语义信息,有助于人们更好地理解与分析图像。图像标签包括了图像单分类和图像多标签分类的问题。图像单分类,即在一组固定的分类标签集合中,对于输入图像从分类标签集合中找出一个与图片内容匹配的分类标签分配给该输入图像。而在现实世界中,一幅图像往往包含丰富的语义信息,如多个目标,场景,行为等,图像多标签分类则旨在为图像分配多个标签以充分表达图像中所包含的具体内容。
本赛题的第一部分,要求参赛团队针对给定的无标记图像集,进行基于机器学习算法的分类,并根据分类结果,为图像打上标签。
推荐系统是一种信息过滤系统,用于预测用户对物品的评分或偏好。推荐系统旨在为用户推荐个性化的在线商品或信息,其广泛应用于众多Web场景之中,来处理海量信息数据所导致的信息过载问题,以此提升用户体验。个性化推荐算法是推荐系统的核心,其主要可以被分为3类,即基于内容的推荐算法、基于协同过滤的推荐算法和混合推荐算法。近年来,非传统的推荐算法,特别是深度学习的应用,使推荐系统的应用范围和效率都得到巨大的提升。
本赛题的第二部分,要求参赛团队使用已打上标签的图片集和用户数据,给出推荐算法方案,并在决赛中展示完整的推荐系统设计方案。
二、赛题介绍
2.1图片集的分类算法实现和标签生产
选定图片集为上海手机交通卡卡面集合。可自由选择一种或多种机器学习算法,对未标记的图片集进行分类,分类的方法和结果可以有一种或多种。并进一步使用分类的结果,对分类后的图片打上描述性标签。
图片标签的生产可以选择以公开的图像标签库为参考并通过算法生成,也可以通过人工的方式为图片打上合适的标签,也可以结合算法与人工来实现最佳结果。最终结果应保证每个图片有5个或以上的描述性二级标签。标签库应尽量体系化,标签体系最少为两级,一级标签有5个或以上维度。
下图为一个简单的标签体系示例,其中一级标签指“设计风格”、“颜色风格”、“应用领域”,二级标签指每个一级标签右侧的描述性标签实例。
2.2图片的推荐算法实现
使用2.1中的图片集及产生的标签库,结合给定的用户行为数据(包括用户个人信息,用户的图片浏览历史,对图片的喜好度和购买意愿等),给出推荐算法方案。可自由选择一种或多种算法组成最终方案,对推荐算法方案的评价简化为单纯基于准确率和召回率:
●准确率定义为系统的推荐列表中用户喜欢的产品和所有被推荐产品的比率:,准确率表示用户对一个被推荐产品感兴趣的可能性。
●召回率定义为推荐列表中用户喜欢的产品与系统中用户喜欢的所有产品的比率,召回率表示一个用户喜欢的产品被推荐的概率。
2.3图片推荐系统设计
结合2.1和2.2中的成果,设计完整的图片推荐系统架构。架构设计应适应产品特性和用户特性,并