超能力归外野 3周时间 机器学习 关于GAN生成图片?

Tips:点击图片进入下一页



感觉定好题目了剩下的也该就剩下自己做了,不过真的是全都不熟悉,基础的知识看笔记能懂,但是想做个项目就很苦恼...求超能力er帮一把,感激。

最后选题是用GAN训练Stanford Dogs Dataset,最后希望生成器能弄出点小狗图片,或者克苏鲁小狗狗,是你,廷达罗斯之猎犬?(因为DCGAN的代码挺好找的所以感觉没问题)

1.但是开始着手又感觉和以前本科机器学习课Project摸鱼artstyle直接用已经有的模型下降一下Gram矩阵不太一样,全都自己训练,效果我还真的完全没概念,看GAN大部分是是截取非常固定的内容(人脸,神奇宝贝图片啥的)然后生成效果不错,我直接拿data set图片跑会不会最后只能生成SAN值警告?预处理上是不是该考虑找什么工具截取狗头了?有什么需要注意的吗

2.我本来考虑的内容只有cross validation然后弄几个表和损失函数下降的图然后report+代码应该就搞得了,但老师看完我的proposal让我在内容里加上衡量图片质量的方法,因为GAN也只是MLE,最后图片蒙骗判别器的概率最高,像不像狗是另一回事,但是作为图像怎么统计上说有多好要有涉及。我真的就不知道该干什么了。比如说我自己训练,然后生成一张图片,接着用其他不相干的神经网络比如google训练好的神经网络,说这个80%是狗,可不可以,但是这样还是并非直接说这张图的质量不错,我不知道自己思路是不是有问题。我打算就参照这篇博文来当自己的判定了(http://medium.com/@jonathan_hui/gan-how-to-measure-gan-performance-64b988c47732),我觉得我这种就像了解下ML的人也不会再project里有什么原创的点子了,但是想先问问大佬,求点拨,时间紧这回真的怕踩坑。

3. 作为为了上课用来说,用一个模型,看懂代码,跑跑改改,选好参数,出结果画图,除了怎么选超参以外,作为data science,一般该做些什么让这个看着像是research呢?抱歉因为现在我除了觉得该让代码跑起来,还是对ML做些什么看着很不错没感觉,一般这种没有点子的时候,有什么万金油的内容可以跑跑吗?


不过也有快乐的事情,当初定组其实是2个人,另一个人根本不是计算机系的,应该没用过Python,建议拿MNIST跑几个模型写个report交了,感觉现在只能做自己想做的事情也挺好的(如果能做出来的话)软件工程的组也好坑,client和server沟通的部分全是我写的,最后还把其他几个feature也包了,但demo其他人还是只能用test case展示server,只有自己负责的部分能2个jar演示一遍,因为心情不好就成天点外卖,然后最近还吃感冒了,哈哈哈哈哈哈





————过期内容————
这是没学过习+自己学习+机器学习的故事

第一次遇到如果没找到分组就变成一个人做情况,各种情况下都小看了这门课,2-3个人的组现在就自己一个人,时间我算只有3周多一下,每周20小时也只有60小时人的预算
教授上课半学期抄书了一遍回归和SVM,连降维都没讲完,大概project就什么都得用了
往好了说,我会Python,各种库不是障碍,但是除此以外我连处理csv的经验都得边学边做,超参也不会调,也没啥数学基础能让我觉得这么干没错

看教授提供的例子,往好了想,选个数据,挑3个不同的模型跑一跑,想出怎么画图就能水过去了,但目前我连如果用这么多的数据,跑好模型要耗时多少时间都不算是清晰,cross validation或者别的各种处理的代码也暂时还不在我脑子里,先不说我后面怎么学,现在对项目的用时的衡量觉得没什么把握。

kaggle目前感兴趣的电影的数据(TMDB 5000 Movie Dataset),觉得如果能训练好以后,根据电影的拍摄人员等信息推测片子的分数应该挺有趣的,回归和神经网络都能用,大概还远远不止
(也想过如果只考虑某个用户的打分也许能做推荐,但是已经觉得做不来了,也不知道这2个不同任务的模型之间有没有什么联系)

但是3周-4周一个人如果连半成品都做不出来那也比较惨,不是很想挂科

简单一些的例子我找到了House Prices: Advanced Regression Techniques,样本量也小,但是我就很担心相当于深度学习项目判断了一次0-9的数字,我这里做了一次w复杂一些的线性回归,还是会完蛋
但是这个项目的题目清晰到和课上学的差不多,没什么让我懵逼的


很想知道哪边才是悬崖,也没地方宣泄,求教ML除了helloworld和酷炫无敌超能力,怎么才是折中难度的项目啊(不知道有相关的群吗?)


感觉把事吐出来就快乐了(其实可能最后做的是铁达尼好沉没的那题,但是纠结弄得浑身难受)。反正早晚得定题,也没组员,下个月死了就地埋了,想看看倒下姿势能不能漂亮点,谢谢


网友评论:
tflearn
imdb各大框架都有现成的,随便搜搜就有了。数据量也不大,拿块70或者80结尾的游戏用n卡一会儿就搞完了。
你是要学习staff和imdb评分间的关系啊?!
这个用nn的话没有合适的输入特征啊,适合非nn的统计学工具解决
做ml之前要先问自己一个问题,这个问题适合ml吗?
如果自己本身是其他领域的,想想自己领域有什么适合的task,图像classification之类的。水起来轻松愉快。

电影数据库这个task我觉得可以结合graph learning来做会很有趣。这个我觉得应当是当下做得不够好、又快速进步的领域。代码也写起来简单,github找个包扔进去用就行了。

我不懂ML,当我瞎说。
你这个属于用知识图谱的LOD(链接数据库)做推荐系统,有一堆的paper,找个实现即可。
歪个楼,第一眼看成时间机器学习
谢谢大佬们,我还真忽略了图像分类也挺合适的,我想想

一下子有一种背景晴天霹雳心声卧槽对啊的感觉,感谢点醒

最后选好题目想做GAN生成小狗图片,不知道已经由DCGAN的tensorflow代码了还需要研究tflearn吗?谢谢。

时间上现在能分配在学习的时间里会分配在tf,怎么处理图片,理论知识上,要是有益处处我也把tflearn考虑进去
换个时间段试着问一次
个人经验感觉小的project用pytorch训GAN会更舒服一些,github上也是大把pytorch代码。
想要从research角度考虑的话,还是需要有motivation吧,所以你打算解一个什么问题呢,用DCGAN的原因是什么呢
好帖mark


感谢,关于motivation,真的没有motivation,只是想假装report不错(用DCGAN不是因为DCGAN converge吗)

还是先着手把最基础的东西跑起来,后面慢慢想了
2天
好帖mark


1. 会;问题是你要截取就会导致输入的规格发生变化,而且数据集这么大的量你要怎么识别狗头,用RCNN做object detection再转换规格重新训练这一套做下来我觉得你可以硕士毕业了。比较简单靠谱的pre processing可以考虑整体翻转和随机失真
2. measurement一向是这类模型比较头疼的问题,换个模型再跑一遍这思路可以,不过说实话本质上只是相当于换了个判别器而已;数学方法就不是短期内能轻易弄明白的了,网上随便找一个就行,我看你找的那个完全可以
3 万金油就是换数据集换模型然后我们比以往模型快了XXX精准了XXX你把代码框架弄出来了搞这些应该还是很快的;或者多调下参把调参经验分析一通也完全没问题
反正你也是regression讲半个学期的初级课程把这些弄完拿个A真的是绰绰有余了,更何况之前还没有相关经验,我觉得已经算是too ambitious了
作为一个非ML/CV领域的人来说,我觉得如果对网络本身不想改的话,弄个CGAN。把像什么狗的种类做成condition什么的,作为课程题目应该是足够了。不过感觉这种一拍脑子就能想出来的点子肯定有人水过了,而且难点更多在于如何获取数据。
还个愿

一个小时考试考了7道题最后都不知道自己怎么写的了,作业基本是满分,那应该是project也差不多拿满了,水过去感觉很惊悚,果然数学不行上这种课会非常自卑,把帖子里看见的点子全加进去写起来顺利很多,总之拿A了谢谢大佬们