加油boy 2016-08-14 15:58 采纳率: 100%
浏览 4085
已采纳

深度学习框架 keras 如何实现 AutoEncoder ?

希望给出一个能运行的详细的自动编码器的示例代码(有注释),
只写核心部分真的不会用。
我想实现这样的:
演示样本随意,比如:{(1,0,0,0),(0,1,0,0),(0,0,1,0),(0,0,0,1)}
1.从文本文档中导入样本(可选)
2.利用自动编码器取出特征(必须)
3.把编码得出的特征保存到一个文本文档中(说明怎么取编码得到的特征也行)

另外我想知道一个:
训练自动编码器是样本越多越好吗?比如我有30万个样本,全部用来训练自动编码器吗,还是说只取其中一部分来训练呢?
我的开发环境是:
图片说明

  • 写回答

3条回答 默认 最新

  • Valtava 2016-08-16 15:42
    关注

    http://keras-cn.readthedocs.io/en/latest/blog/autoencoder/
    仔细读一下里面的例子就可以了。
    假设你的input 叫做 in_data, 中间特征层叫做 code, 最终输出叫做out_data,
    那么训练完成之后只需要encoder = Model(input=in_data, output=code)就可以构建encoder部分(特征提取),
    然后features = encoder.predict(X_train)就可以得到特征 (假设你的输入叫做X_train)

    得到的特征(上述features)变量是个numpy数组,你可以随意把这个数组存到本地(npy, pickle, 循环遍历等方法看你个人喜好。。。)

    理论上,样本多了当然比少了好,而且本来autoencoder就不需要label,所有数据全用了在分类问题里都不能算作弊(毕竟没有用label)

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 关于#hadoop#的问题
  • ¥15 (标签-Python|关键词-socket)
  • ¥15 keil里为什么main.c定义的函数在it.c调用不了
  • ¥50 切换TabTip键盘的输入法
  • ¥15 可否在不同线程中调用封装数据库操作的类
  • ¥15 微带串馈天线阵列每个阵元宽度计算
  • ¥15 keil的map文件中Image component sizes各项意思
  • ¥20 求个正点原子stm32f407开发版的贪吃蛇游戏
  • ¥15 划分vlan后,链路不通了?
  • ¥20 求各位懂行的人,注册表能不能看到usb使用得具体信息,干了什么,传输了什么数据