十三 发自 凹非寺
量子位 报道 | 公众号 QbitAI给你一张图片,你能想象它的声音吗?
一个叫SpectroGraphic的神器就能做到这点。
例如,给定一个“怪物史莱克”的照片,通过这个工具,就能生成其对应的声谱图。
图像嵌入声谱图
大多数声音是许多声波的复杂组合,而每一种声波都有不同的频率和强度。
声谱图(spectrogram)是一种表示声音的方法,它的横轴是时间,纵轴是频谱。
△声谱图示例而SpectroGraphic所做的工作就是获取一张图像,简单地把它解释成一张声谱图。
这样,就可以通过产生的声音,便将图像嵌入到了声谱图中。
是不是非常酷炫?
现在,项目已开源,每个人都可以体验了!
项目安装
首先,流量套餐运行如下代码来获取命令行工具spectrographic:
pip install spectrographic也可以直接把stand-alone\文件夹里的spectrographic.py文件,作为命令行工具使用。
此外,还需要确保满足 requirements.txt 文件中涉及的所有依赖项。
可以通过如下命令来进行安装:
pip install requirements.txt在使用 pip 进行安装之后,只需要在控制台中运行 spectrographic […]。
在使用stand-alone脚本时,必须使用 python spectrographic.py […]。
还可以简单地从 SpectroG流量套餐raphic.base 中导入 SpectroGraphic 类。
命令行工具的使用
usage: spectrographic [-h] [–version] -i PATH_TO_IMAGE [-d DURATION] [-m MIN_FREQ] [-M MAX_FREQ] [-r RESOLUTION] [-c CONTRAST] [-p] [-s SAVE_FILE] Turn any image into sound. optional arguments: -h, –help show this help message and exit —流量套餐version show programs version number and exit -i PATH_TO_IMAGE, –image PATH_TO_IMAGE Path of image that we want to embed in a spectrogram. -d DURATION, –duration DURATION Duration of generated sound. -m MIN_FREQ, –min_freq MIN_FREQ Smallest frequency used fordrawing the image. 流量套餐 -M MAX_FREQ,–max_freq MAX_FREQ Largest frequency used for drawing the image. -r RESOLUTION, –resolution RESOLUTION Vertical resolution of the image in the spectrogram. -c CONTRAST, –contrast CONTRAST Contrast of the image in the spectrogram. -p, –play Directly play the resultin流量套餐g sound. -s SAVE_FILE, –save SAVE_FILE Path to .wav file in which to save the resulting sound.如果你的源图像在./source.png,想要生成10s的音频,频率范围为10kHz到20kHz,还希望保存为sound.wav,最终还要播放音频。
那么就运行如下代码:
spectrographic –image ./source.png –min_freq 10000 –max_freq 20000 –duration 10 –save sound.wav –play如果你正在使用stand-alone脚本:
python spe流量套餐ctrographic.py –image ./source.png –min_freq 10000 –max_freq 20000 –duration 10 –save sound.wav –play作者简介
△右:Levi BorodenkoLevi Borodenko,目前在牛津大学攻读数学和统计学硕士学位。学术研究重点是随机分析和机器学习。
本科也就读于牛津大学,2017-2018担任PROMYS Oxford的辅导员,2018-2019年担任PROMYS Boston的首席辅导员。
更多开源项目可访问如下链接:
https://github.com/LeviBorodenko传送门
项目地址:
https流量套餐://github.com/LeviBorodenko/spectrographic个人简介:
https://cv.levib.dev/— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
友情提醒: 请添加客服微信进行免费领取流量卡!
QQ交流群:226333560 站长微信:qgzmt2
原创文章,作者:sunyaqun,如若转载,请注明出处:https://www.dallk.cn/57040.html