请注意

罗兰在MATLAB的艺术已经存档,不会被更新。

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!

网络公开课的脉冲

Coursera是一个技术平台,启动电流MOOCs繁荣。尽管网络公开课有更多的球员现在,它仍然是一个领先的公司在这个领域。但是他们是如何做这些天提供高等教育大众在线吗?

今天的嘉宾博客古原竹内使用Courera,想与大家分享一个分析的数据。

我是网络公开课的大粉丝,我受益很多从免费的在线课程Coursera,如斯坦福大学机器学习课程。像许多网站这些天,Coursera提供数据REST api。Coursera提供了大量的api,但目录可用的api没有OAuth身份验证。我们可以找到的细节Coursera与这些api提供的课程。

我们可以试着回答这样的问题“怎么干和non-STEM课程分解在大学吗?

内容

JSON支金宝app持R2014b

JSONREST api是一种很常见的数据格式,以及Coursera api也以JSON格式返回结果。MATLAB现在支持J金宝appSON开箱即用的R2014b。你总是可以使用JSON在MATLAB上利用用户贡献的MATLAB程序文件交换,但是内置的JSON支持使我们更容易共享金宝app脚本,使用JSON,因为我们不需要担心依赖关系。

让我们试试新功能使用Coursera api。调用REST API非常简单webread

restApi =“https://api.coursera.org/api/catalog.v1/courses”;params =“会话、大学、类别”;resp = webread (restApi“包括”、params weboptions (“超时”、60));

webread返回的JSON响应作为结构数组。进一步处理的数据在一个单独的脚本processData.m——查看细节如果感兴趣。

我们需要决定哪些类别代表STEM学科。当有多个类别分配到一个给定的课程,我们把它当作一个茎课程只要其中一个是包含在茎类别。

processData
干细胞种类的计算机科学:理论经济学和金融学的“医学”的数学物理和地球科学的生物学和生命科学的“计算机科学:系统与安全”“计算机科学:软件工程”工程的统计和数据分析的计算机科学:人工智能的“物理”“化学”“能源和地球科学”

策划课程与课程的大学

作为一个检查,让我们画出的课程和大学的会话数。一个单一的课程可以反复在多个会话。因此你可以确定一个给定的寿命和年龄计算课程的会话。

如果这是一个新的课程,或者不重复,那么你只有一个会话课程。我们可以用这个作为基线,并检查各高校如何扩大他们的课程相对于基线。

R2014b伴随着新的MATLAB图形系统,但你仍然可以使用熟悉的绘图命令。

%组织课程的数量分组= 1(高度(大学),1)* 2;分组(大学。课程> 25)= 1;分组(大学。课程< = 10)= 3;%的阴谋图gscatter (universities.courses universities.sessions,分组)h = refline (1,0);集(h,“颜色”,“米”,“线型”,“:”)h = refline (2,0);集(h,“颜色”,“米”,“线型”,“:”)h = refline (3,0);集(h,“颜色”,“米”,“线型”,“:”0)h = refline(6日);集(h,“颜色”,“米”,“线型”,“:”)包含(课程的数量);ylabel (会话的数量);标题(”字形大小{14}课程由课程大学的);传奇(“大学25 +课程”,“大学与10 +课程”,“大学与1 - 10课程”,“参考线:1会话/课程”,“参考线:2会议/课程”,“参考线:3会议/课程”,“裁判:6会话/课程”,“位置”,“西北”)%增加大学的名字i = 1:高度(大学)如果universities.courses(我)> 10 & & universities.sessions(我)> 20文本(universities.courses(我),universities.sessions(我),我universities.shortName {},“字形大小”,12)结束结束

你可以看到,斯坦福,佩恩(宾夕法尼亚大学),JHU (Johns Hopkins)和杜克领先。他们是早期采用者,基于会话的数量。有趣的是北大(北京大学)领先的国际机构。他们在中国提供的课程。Coursera直到最近才开始国际伙伴关系,这是相当了不起的北大在相对短的时间内扩大了他们的在线内容。左边最近的参赛者是用更少的课程和会议。

建立球员试图扩大通过重复会话。JHU似乎特别积极的课程提供的数量和它们是如何重复会话。

策划杆比率大学

情节让我们课程的数量比干课程的大学。这将告诉我们学校正在投资于在线教育的内容,以及他们是否专注于干细胞或non-STEM科目。标记的大小表明会话相关联的总数,所以它也给了我们他们参与Coursera多久。注意到parulacolormap colorbar中使用,新的默认colormap R2014b。

%使用对话数设置标记大小markerSize = universities.sessions;%我们需要扩展标记大小markerSize = (markerSize - min (markerSize)) / (max (markerSize)分钟(markerSize));markerSize = markerSize * 1000;markerSize (markerSize = = 0) = 1;蜱虫标签变化百分比反映了原始值barticks = num2cell (20:20:200);%创建一个散点图图散射(universities.courses universities.stem_ratio、markerSize markerSize,“填满”40)xlim ([0]) h = colorbar (“TickLabels”,barticks);h.Label。字符串=”字形大小{11}会话的数量;标题(”字形大小{14}干课程通过大学Coursera”比)包含(”字形大小{11}课程的数量);ylabel (”字形大小{11}干课程的比例);%增加大学的名字i = 1:高度(大学)如果universities.stem_ratio(我)~ = 0 & & universities.stem_ratio(我)~ = 1 & & universities.courses (i) > = 5文本(universities.courses(我),universities.stem_ratio(我),universities.shortName {},“字形大小”,12)结束结束%添加参考线线(25 [25],[0,1],“线型”,“:”)线(10 [10],[0,1],“线型”,“:”)线([0 40],[0.5 - 0.5],“线型”,“:”)

斯坦福干细胞科目很重,而另一些则更加平衡。最近的参赛者在左边有一个广泛的方差在茎重他们的课程。可能的适应不同学科之间的不同吗?

策划每类别课程的比例

我们可以画出每个类别课程的比例以在Coursera看到学科的相对表现。一门课程可以属于多个类别,在这种情况下计算在平均分配包括类别。注意,您现在可以转动轴蜱虫在R2014b标签。

%被大学类的计数catByUniv = 0(高度(大学),高度(类别);i = 1:长度(T.categories)行= ismember (universities.id, T.universities(我));坳= ismember (categories.id T.categories{我});catByUniv(行,坳)= catByUniv长度(行,坳)+ 1 / (T.categories{我});结束%段数量的大学课程catByTiers =[总和(catByUniv(分组= = 1:));sum (catByUniv(分组= = 2,:));sum (catByUniv(分组= = 3,:)));%的排名类别课程的数量[~,排名]=(总和(catByUniv(大学。:课程> 25日)),“下”);%被类别课程的比例catByTiers = bsxfun (@rdivide catByTiers, sum (catByTiers, 2));%画出条形图图xticks = [{};categories.name(排名),{});h =酒吧(catByTiers(:,排名)');xlim (26 [0]);甘氨胆酸ax =;集(ax,“XTick”,0:26);集(ax,“XTickLabel”,xticks);集(ax,“XTickLabelRotation”,270);标题(”字形大小{14}每类别课程的比例)传说(“大学25 +课程”,“大学与10 +课程”,与1 - 10的大学课程的,“位置”,“最佳”)

看起来有更多干细胞早期采用者之间的偏见(大学的课程),但新进入者用更少的课程(大学)倾向于有更多non-STEM课程。类别,如社会科学、人文科学、商业和管理、教育、教师Professioal发展,音乐、电影和音频正在崛起。

总结

为什么我们看到这non-STEM转变?有许多可能的解释。

  • 一开始,依靠autograders Coursera课程。他们适合定量STEM学科,但不是non-STEM科目。
  • Autograders是自定义构建各自的课程,他们实际上是满的SaaS应用程序。很难规模课程如果您需要的数量为每个课程构建一个定制的SaaS应用程序能够承受大量的高峰流量接近最后期限的- - -这个人类行为相当普遍
  • 之后,Coursera介绍一群来源文章评分系统,可以使用多个课程。这释放大学创建自定义SaaS应用程序的负担。
  • 这导致了快速扩张的课程并使non-STEM可行的主题。事实上,我花了大量的干细胞从JHU课程,他们倾向于使用而不是autograders论文评分系统。

有问题我们无法回答手头的数据。例如,这种转变是由供应方面的便利(大学)或non-STEM科目由公众的需求?

Coursera课程没有严格的先决条件,但干课程的酒吧依然很高。因此很可能的潜在市场规模较大non-STEM科目。

您还看到是多么容易使用REST API在R2014b JSON响应,和有一个快速浏览的一些新功能更新MATLAB图形系统。下载新版本,试着自己和分享你所发现的这些新特性在这里!




发表与MATLAB®R2014b


  • 打印”></a></li>
             <!-- 1. email -->
             <li><a class=发送电子邮件”></a></li>
             <!-- 3. twitter -->
             <li style=

评论

留下你的评论,请点击在这里MathWorks账户登录或创建一个新的。