学生休息室

分享学生如何在日常项目中使用MATLAB和Simulink的技术和现实例子#学生成功#金宝app

用MATLAB破解一个YouTube创建者助手

你是一个内容创作者,希望让你的内容缩略图更吸引眼球吗?今天参加我们节目的是内森方 而且 斯图尔特方 来自加拿大皇后大学!继续往下读,了解更多关于他们的黑客如何帮助你!交给你们了。
大家好,这里是Nathan和Stuart Fong !我们是加拿大安大略省皇后大学计算机科学专业的二年级学生。我们是黑客马拉松爱好者,喜欢学习数据科学和机器学习。7月15-17日,我们参加了SelfieHacks二世黑客马拉松由黑客大联盟(MLH)并创建了一个名为YouTube Creator Assistant的项目,该项目获得了MATLAB最佳使用奖。
YCA团队照片。jpeg
内森 (左)和 斯图尔特 (右)

灵感

进入SelfieHacks II时,我们不知道要做什么,但我们知道我们想要创建一个赋予内容创作者权力的项目。在我们的头脑风暴会议中,我们想知道“所有内容创作者都在努力解决什么问题?”,在那里我们想到了帮助内容创作者发展他们的社区。然后,我们将范围缩小到帮助YouTube创作者,并帮助他们的内容获得更广泛的受众。
如果我们想要追踪有多少人积极参与一个频道,最好的指标之一是他们的视频的观看次数。由于浏览量和订阅者是一个视频或频道成功的主要指标,我们想做一个工具来增加这些数字。这就增加了他们的视频在新用户面前的曝光率,使频道得以发展。这样想,我们终于想出了我们的项目想法,我们称之为YouTube Creator Assistant。

分解问题

我们首先查看YouTube主页,确定哪些元素可以说服用户点击某个视频而不是另一个视频,比如标题和缩略图。在我们的程序中,我们希望利用视频的这些组件来生成预测的观看次数。用户可以测试各种组件的组合,如缩略图、标题、视频时长和类别,以最大限度地提高观看次数。虽然编辑可以在视频发布后进行试错,但我们的解决方案允许事先完成。这样,在最关键的时刻——也就是刚开始的时候,就可以更容易地获得意见。

我们是如何实现它的?

我们使用视频缩略图而且youtuber说些什么数据集,但在我们使用它们之前,我们必须清理数据。一开始,有些专栏是不需要的,比如视频链接和文字记录。虽然我们可以使用视频本身来提取一些功能,但我们决定暂时不使用它,并删除了这些列。接着说,有些变量的格式不是可用的,其中观看者和订阅者的数量是缩写,视频长度是HH:MM:SS格式。在MATLAB中解决这个问题非常方便,因为我们可以打开旁边的数据表,让我们实时看到变化。
YCA Data.png
为了创建我们的模型,我们首先查看我们拥有的数据类型,其中包括缩略图的图像、标题的语言数据以及其余信息的表格数据。对于缩略图,我们使用卷积神经网络(CNN)来识别图像中引人注目的元素(又名标题党)。接下来,对于标题,我们提取了我们认为有用的特征,比如长度和大写字母的百分比。最后,对于表格数据,我们使用一个完全连接的神经网络来预测每个变量与最终观众数量的关系。然后,我们结合两个网络的输出,给出我们预测的观众数量。
在介绍MATLAB的过程中Local Hack Day: Build 2022研讨会,我们想尝试使用其中一个工具,深度网络设计器,来构建我们的神经网络。在使用它的时候,我们看到建立模型原型是多么容易。拖放界面允许我们在不降低代码可读性的情况下快速更改或交换我们的层。这个过程非常简单,只需创建模型的外观,选择输入和输出数据存储,然后开始训练。
YCA Network.png
为了部署我们的模型,我们想要使用Gradio,因为它是我们更熟悉的web界面。问题在于,我们的模型是用MATLAB创建的,而Gradio使用的是Python编程语言。幸运的是,MATLAB提供了一种叫做MATLAB引擎的东西,它允许我们在Python中运行MATLAB代码。要做到这一点,我们首先它安装,然后使用以下代码导入:
进口matlab.engine
Eng = matlab.engine.start_matlab()
然后,我们能够从Python中的Gradio web应用程序中获取输入,将它们输入到我们的MATLAB模型中,并将预测的视图计数输出为Python整数。

结果

我们通过创建一个假的缩略图并填充一些关于我们假设的视频和频道的细节来测试我们的模型。然后我们尝试改变缩略图和标题,以吸引更多的观众,正如预期的那样,预测的观看次数增加了!
总的来说,我们完成的模型在新的输入上表现良好,其中更“点击诱饵”的缩略图或标题预计会有更多的观看次数。尽管如此,我们在测试过程中发现,它在输出准确的观众数预测方面有一些困难
+订阅人数较少的频道。这对于模型的预期目的来说是很好的,但我们认为它将受益于一些额外的数据,因为当前的数据仅以最流行和最受欢迎的创造者为特征。在未来,我们计划为模型提供更多具体包含订阅用户较少的YouTube频道的数据,以便模型能够更好地识别特定功能如何影响最终的观看者数量。观看这个视频,了解我们的代码是如何工作的
YCA演示3.jpg

关键的外卖

与Python相比,我们发现MATLAB更容易用于原型设计,因为有许多内置函数可以使编码快速简单。大量的文档降低了尝试新事物的难度,使我们能够探索MATLAB的许多特性。YouTube Creator Assistant是一个很有趣的项目,我们学到了很多关于MATLAB在数据科学和机器学习方面的特性,以及它的深度网络设计器和MATLAB引擎。
如果您对这个项目有任何意见或问题,请随时与我们联系!我们的代码是可以在Github上找到,你可以在我们的网站上看到更多关于这个项目的信息Devpost提交页面

|
  • 打印
  • 发送电子邮件

コメント

コメントを残すには,ここをクリックしてMathWorksアカウントにサインインするか新しいMathWorksアカウントを作成します。