时间安排
✔报名时间:即日起至2024年12月7日23:00
✔项目持续时间: 2024年12月9日~2024年12月15日
项目介绍
✔ 我们小时候都在语文试卷上做过“看图说话”的题目:根据给出的图画内容写一段话。那时候的你,想过有朝一日机器也能像我们一样完成这样的题目吗?
✔ 本项目引导参与者学会如何把一个“看图说话”的问题规范成为一个 有监督的建模问题,并在此基础上,通过标准的 迁移学习和 LSTM模型为该问题提供一个初步的解决方案。项目使用Kaggle上的Flickr 8K Dataset数据集,提供案例讲解视频、jupyter notebook编写的代码文档、云GPU计算服务等资源
✔ 适用对象:(1)具备一定的深度学习基础: 熟悉Keras框架,了解基本的CNN模型构建方式,了解BN、数据增强、迁移学习等常用技巧;(2)项目期间每周能保证3~4小时学习时间
“看图说话”(image captioning)效果示意图
你的收获
✔学会构建一个最基本的看图说话模型
掌握如何将图片通过迁移学习变成一个高维X向量
掌握如何对文本进行向量化处理
掌握如何构建一个看图说话模型
✔获得一份能力证明:狗熊会为按要求完成全部TASK的营员提供实习证明;优秀营员有机会获得知名企业的工作机会,简历直推高管
✔积累更多实战经验和影响力:狗熊会精品案例组、企业合作研究项目组优先招募优秀营员;营员优秀作品经过审核后可发表在狗熊会公众号,扩大营员的知名度和影响力
实习证明样例
任务清单
✔Task1:迁移学习提取图片特征
✔Task2:文本数据预处理
✔Task3:看图说话模型构建与应用
项目说明
✔项目全程采取 线上远程形式进行,项目包含若干个TASK。每个TASK周期都包含如下环节:(1)导师发布任务要求和参考资料;(2)营员自学参考资料,如果有自己无法解决的问题,向老师和助教求助;(3)营员完成任务后,老师反馈评分+评语,对重点难点和多发问题做集中总结
✔项目依托 狗熊会与 知名GPU共享平台矩池云共同打造的深度学习平台。上机所需要 GPU环境基本配置:RTX2080 GPU,每秒浮点运算次数13.13 TFLOPS,显卡内存 11 GB,GPU带宽 616 GB/s。项目费用已包含在该环境下完成任务所需的基本机时(不超过50小时);如果机时不够,营员可通过狗熊会以优惠价格继续购买;未消耗完的机时,概不退款
✔ 项目结束后180天内,营员可继续使用项目相关所有资料进行复习和强化训练,并可继续通过狗熊会或矩池云以折扣价购买GPU机时
GPU配置单
费用说明
✔ 费用:680元/人
可按实际支付金额开具发票,名目“实习服务费”,在退款期结束后统一征集开票信息
✔ 售后服务-1天无理由退款:
售后退款条款:本项目接受“1天无理由退款”。“1天无理由退款”指商家(狗熊会)向其微店“狗熊会在线项目”营员提供的特别售后服务,允许营员按本规则的规定对其已购“狗熊会个人项目”服务进行退款服务。具体为,在“狗熊会在线项目”开始后的当天零时起计算时间,满24小时为1天内,已购买“狗熊会在线项目”的营员可向商家提出无理由退款申请,经商家确认后将已支付金额在3个工作日内通过营员支付渠道返还用户相应账户
接受高校客户集体报名。关于项目与报名如有问题,请咨询study@clubear.org。返回搜狐,查看更多
责任编辑: