亚洲欧美另类激情校园动漫卡通,亚洲一区二区制服在线,亚洲v国产v天堂网,香港三级日本三级少妇三级

          愛(ài)學(xué)習(xí),愛(ài)生活,會(huì)學(xué)習(xí),會(huì)生活,人生有百學(xué)網(wǎng)更精彩!
          愛(ài)學(xué)習(xí) | 愛(ài)生活

          登峰杯大賽數(shù)據(jù)挖掘全國(guó)一等獎(jiǎng)作品分享

          發(fā)布于:百學(xué)網(wǎng) 2018-02-06

          登峰杯大賽數(shù)據(jù)挖掘全國(guó)一等獎(jiǎng)作品分享

            導(dǎo)讀

            本期特別推薦“登峰杯”大賽數(shù)據(jù)挖掘全國(guó)總決賽一等獎(jiǎng)作品,作者是來(lái)自浙江省湖州中學(xué)的四位學(xué)霸級(jí)同學(xué)。本篇論文的核心內(nèi)容分為“探索規(guī)律”和“建立模型”。對(duì)于前者,小組以“發(fā)現(xiàn)規(guī)律”-“構(gòu)造定律”-“驗(yàn)證定律”的流程相繼構(gòu)造了“八日定律(余熱定律)”、“五日定律”、“誤差定律”等定律,并通過(guò)統(tǒng)計(jì)學(xué)檢驗(yàn)加以驗(yàn)證。此外,論文中定義的“波動(dòng)系數(shù)”、“跟風(fēng)系數(shù)”、“A/B/C類(lèi)電視劇”等均為新定義參數(shù),在對(duì)電視劇特征描述方面有所創(chuàng)新。對(duì)于后者,小組舍棄了傳統(tǒng)的加權(quán)求和模型,將幾何模型與數(shù)字模型對(duì)接,通過(guò)螺旋圓柱線這一圖形描述電視劇熱度隨播放時(shí)間的上升,其中劇集與圓周,半徑與收視人口等等均能巧妙地一一對(duì)應(yīng),起到了同時(shí)從數(shù)據(jù)和形意上解釋熱度這一概念的目的?傮w來(lái)說(shuō)是本文是一篇寫(xiě)作非常規(guī)范,龐雜的數(shù)據(jù)收集并且論文內(nèi)含豐富創(chuàng)意,可見(jiàn)作者其中的心血,非常值得各位同學(xué)借鑒學(xué)習(xí)。

            團(tuán)隊(duì)隊(duì)員介紹

            ●殷瞻遠(yuǎn):現(xiàn)就讀于美國(guó)加州大學(xué)洛杉磯分校(UCLA)應(yīng)用數(shù)學(xué)專(zhuān)業(yè),畢業(yè)于浙江省湖州中學(xué),曾獲美國(guó)數(shù)學(xué)競(jìng)賽(AMC)全球前1%榮譽(yù)稱(chēng)號(hào),并參加美國(guó)數(shù)學(xué)邀請(qǐng)賽(AIME)。曾率隊(duì)參加第一、二屆登峰杯數(shù)學(xué)建模競(jìng)賽獲得初賽二等獎(jiǎng),第二屆登峰杯數(shù)據(jù)挖掘競(jìng)賽,全國(guó)一等獎(jiǎng)獲全國(guó)物理競(jìng)賽三等獎(jiǎng),浙江省物理競(jìng)賽一等獎(jiǎng),

            ●凌程翌:現(xiàn)就讀于合肥工業(yè)大學(xué)電子信息工程專(zhuān)業(yè),畢業(yè)于浙江省湖州中學(xué),曾參加第一、二屆登峰杯數(shù)學(xué)建模競(jìng)賽獲得初賽二等獎(jiǎng),第二屆登峰杯數(shù)據(jù)挖掘競(jìng)賽全國(guó)一等獎(jiǎng),連續(xù)三年獲得浙江省信息學(xué)競(jìng)賽三等獎(jiǎng),精通Pascal,C,C++,Python,MATLAB等多種編程語(yǔ)言。

            ●黎沈少杰:現(xiàn)就讀于復(fù)旦大學(xué)軟件工程專(zhuān)業(yè),畢業(yè)于浙江省湖州中學(xué),曾參加第一、二屆登峰杯數(shù)學(xué)建模競(jìng)賽獲得初賽二等獎(jiǎng),第二屆登峰杯數(shù)據(jù)挖掘競(jìng)賽全國(guó)一等獎(jiǎng),全國(guó)第十七屆國(guó)際機(jī)器人奧林匹克中國(guó)區(qū)競(jìng)賽人形挑戰(zhàn)項(xiàng)目金牌,人形表演項(xiàng)目金牌。

            ●朗逸霖:現(xiàn)就讀于重慶大學(xué)通信工程系,畢業(yè)于浙江省湖州中學(xué),曾獲得第一屆登峰杯課外學(xué)術(shù)作品大賽全國(guó)二等獎(jiǎng),參加第二屆登峰杯數(shù)據(jù)挖掘競(jìng)賽全國(guó)一等獎(jiǎng),第三十屆浙江省青少年科技創(chuàng)新大賽二等獎(jiǎng)。其“汽車(chē)高溫維生系統(tǒng)”獲國(guó)家實(shí)用新型ZL。

            論文摘要

            本文探索電視劇收視率和播放量中隱含的各種定律,在看似雜亂無(wú)規(guī)律的收視率和播放量中尋找其變化的必然性,為電視劇收視率和播放量的預(yù)測(cè)做好鋪墊。同時(shí)本文從多個(gè)角度出發(fā)探索收視率與播放量之間的聯(lián)系和區(qū)別,探索其描述準(zhǔn)確度的不同以及數(shù)據(jù)變化的特點(diǎn)和趨勢(shì)性。通過(guò)歸納出的結(jié)論,本文試圖發(fā)現(xiàn)不同種類(lèi)電視劇熱播前后的播放量規(guī)律。

            基于傳統(tǒng)的數(shù)據(jù)模型,本文還結(jié)合幾何學(xué)知識(shí)以及物理學(xué)知識(shí)對(duì)電視劇熱度進(jìn)行全面新定義,通過(guò)新定義的熱度動(dòng)態(tài)地預(yù)測(cè)電視劇前十熱度榜,并且解釋新模型的合理性。

            關(guān)鍵詞:收視率;播放量;八日定律;五日定律;概率曲線圖;波動(dòng)/跟風(fēng)系數(shù);圓柱螺旋線;水冷;熱度預(yù)測(cè)

            問(wèn)題分析

            1、對(duì)電視劇后三集收視率預(yù)測(cè)問(wèn)題的分析

            由于對(duì)電視劇后三集收視率的預(yù)測(cè)是基于電視劇先前的收視情況而定的,而電視劇先前的收視情況的變化模式則因電視劇而異。因此,根據(jù)電視劇先前的收視情況定義指標(biāo),通過(guò)這些指標(biāo)對(duì)電視劇進(jìn)行分類(lèi),再通過(guò)其他相關(guān)指標(biāo),使用統(tǒng)計(jì)學(xué)方法,推算電視劇后三集收視率的合理區(qū)間。

            2、對(duì)熱播前后播放量關(guān)系的探究

            根據(jù)電視劇熱播期間和熱播后播放量變化模式的不同,本文打算從熱播前和熱播后各日播放量之和入手,并且著重研究收官附近各日播放量變化的模式。另外本文發(fā)現(xiàn),由于引進(jìn)劇有相當(dāng)一部分并非同步引進(jìn),因而對(duì)于延遲引進(jìn)的電視劇應(yīng)當(dāng)予以分別討論。

            3、對(duì)收視率與播放量間異同的分析

            由于收視率和播放量均為評(píng)價(jià)電視劇好壞的指標(biāo),因而本文從“兩者呈正相關(guān)關(guān)系”這一假設(shè)出發(fā),探究?jī)烧叩穆?lián)系;對(duì)于兩者的不同,本文決定從指標(biāo)的準(zhǔn)確程度以及兩者的圖像出發(fā)結(jié)合生活實(shí)際探究其本質(zhì)上的不同。

            4、對(duì)新熱度定義的探究

            由于傳統(tǒng)的熱度定義僅僅以收視率和播放量作為衡量標(biāo)準(zhǔn),而忽視了輿論等因素對(duì)于熱度的影響,綜合考慮,這一標(biāo)準(zhǔn)是不全面的。若將其他因素納入考慮標(biāo)準(zhǔn),通常的想法是將該問(wèn)題化歸為多因子分析問(wèn)題,排除各因素之間的相互關(guān)系,通過(guò)綜合評(píng)價(jià)模型以公式表述。但本團(tuán)隊(duì)結(jié)合幾何學(xué)知識(shí),一反常規(guī),著重突出傳統(tǒng)數(shù)據(jù)(表象數(shù)據(jù))和輿論數(shù)據(jù)(隱象數(shù)據(jù))之間的聯(lián)系,通過(guò)圓柱螺旋線的形式,循環(huán)往復(fù)地描述熱度的上升,而以模擬高溫物體在環(huán)境下冷卻的形式描述熱度的下降。

            論文內(nèi)容精選

            后三集收視率預(yù)測(cè):如何判定1/2/3類(lèi)劇?

            通過(guò)繪制半程收視率占全程收視率比值的箱線圖,確定1/2/3類(lèi)劇分類(lèi)標(biāo)準(zhǔn),使得該三個(gè)區(qū)間預(yù)測(cè)可信度近似。

            如何確定后三集收視率區(qū)間?

            使用Inverse Normal函數(shù),計(jì)算在包括不同大小的數(shù)據(jù)范圍的情況下,后三集比后半程(全程)收視率的范圍,可同時(shí)求得范圍和預(yù)測(cè)精度。前者適用于1類(lèi)劇,后者適用于2/3類(lèi)劇。

            后三集收視率結(jié)論與預(yù)測(cè):

            在60%的預(yù)測(cè)準(zhǔn)確度下

            一類(lèi)。(半程/全程<90%)后三集平均收視率/后半程平均收視率

            二類(lèi)劇:(90%<半程/全程<103.75%)后三集平均收視率/全程平均收視率

            三類(lèi)。(半程/全程>103.75%)后三集平均收視率/全程平均收視率

            隨著預(yù)測(cè)準(zhǔn)確度提高收視率區(qū)間有所增大(詳見(jiàn)論文)。

            熱播期前后播放量變化模式

            對(duì)于A類(lèi)劇,我們發(fā)現(xiàn)電視劇播放量曲線與高斯函數(shù)相近,但在收尾階段,高斯函數(shù)積分求得預(yù)測(cè)電視劇播放量與實(shí)際播放量有較大偏差,以下是4部具有代表性電視劇的播放量散點(diǎn)圖與擬合曲線:

            藍(lán)色柱為高斯函數(shù)擬合優(yōu)度

            紅色柱為指數(shù)函數(shù)擬合優(yōu)度

            黃色柱為收官八日內(nèi)播放量占總播放量比值中,b+c的值一般等于播放天數(shù)+8日。因此,我們將其前后分別用高斯和指數(shù)函數(shù)進(jìn)行擬合。

            八日定律結(jié)論與預(yù)測(cè)

            1.電視劇收官八日內(nèi)電視劇播放量呈高斯函數(shù)變化;

            2.電視劇收官八日后電視劇播放量呈指數(shù)函數(shù)變化;

            3.電視劇收官八日內(nèi)播放量約占電視劇收官108日內(nèi)播放量的88%;

            得出八日定律后,我們發(fā)現(xiàn)在電視劇收官日附近(即高斯函數(shù)達(dá)到頂峰附近時(shí)),往往散點(diǎn)圖(即真實(shí)值)高于函數(shù)曲線(即預(yù)測(cè)值),因此我們對(duì)收官前后五日的數(shù)據(jù)進(jìn)行研究:

            收官五日定律結(jié)論與預(yù)測(cè)

            1.電視劇收官前后五日內(nèi)電視劇播放量往往高于高斯函數(shù)擬合結(jié)果;

            2.電視劇收官前后五日內(nèi)電視劇播放量五次函數(shù)(擬合優(yōu)度為1)與高斯函數(shù)擬合預(yù)測(cè)值之差約為收官后108日內(nèi)電視劇播放量的3.2%;

            電視劇收視率與播放量間的異同

            由于無(wú)法直接尋找收視率與播放量間的關(guān)系,因此我們對(duì)電視劇進(jìn)行聚類(lèi)。以收官后108天為界,之前為熱播劇,之后為后熱播劇。對(duì)于熱播劇,則尋找其熱播期內(nèi)的收視率與播放量間的通用關(guān)系;對(duì)于后熱播劇,則尋找收視率與播放量間的隨機(jī)概率關(guān)系。

            為統(tǒng)一播放量的評(píng)估標(biāo)準(zhǔn),我們將播放量推算至電視劇收官108天后,以下是對(duì)于未收官電視劇和已收官電視劇的預(yù)測(cè)方法:

            已收官電視。

            未收官電視。

            根據(jù)已有電視劇播放量擬合函數(shù);

            ·根據(jù)擬合函數(shù)積分得到收官8日內(nèi)播放量;

            ·根據(jù)收官8日內(nèi)播放量和八日定律求得收官108天內(nèi)播放量;

            ·熱播劇收視率與播放量間函數(shù):

            由于后熱播劇收視率與播放量間并沒(méi)有強(qiáng)相關(guān)關(guān)系,存在一定隨機(jī)性,因此我們通過(guò)NormalCDF函數(shù)(假設(shè)固定收視率,播放量呈正態(tài)分布)確定當(dāng)收視率一定時(shí),播放量低于某一數(shù)值的概率,從而形成不同可能性的概率曲線。

            熱度螺旋上升模型

            表象線代表傳統(tǒng)數(shù)據(jù)(收視率和播放量)對(duì)電視劇熱度帶來(lái)的增量。由于收視率和播放量均為可明顯衡量電視劇熱度的因素,并且表象線位于每周圓柱螺旋線的外側(cè)部分,因而稱(chēng)之其為表象線。表象線既描述收視率/播放量每日相對(duì)變化的大小,又描述其絕對(duì)大小,故表象線升角可為負(fù)值(熱度衰減)。每周表象線所帶來(lái)的熱度增量與其升角和半徑均有關(guān)。

            新評(píng)估模型ZD的優(yōu)勢(shì)在于其為動(dòng)態(tài)模型,即每部電視劇的熱度值是隨時(shí)間變化而變化的,因其每日收視率/播放量等表象線因素和好評(píng)率、搜索量、彈幕數(shù)等隱象線因素均會(huì)更新,因此電視劇的圓柱螺旋線即會(huì)更新一圈,產(chǎn)生當(dāng)日的新熱度值。動(dòng)態(tài)的評(píng)估模式,可以增加電視劇的評(píng)估維度(即可以以時(shí)間為維度評(píng)估電視劇熱度,可以得到電視劇各集的評(píng)價(jià),也可以在不同的時(shí)間階段對(duì)電視劇進(jìn)行橫向或縱向比較)。

            總之,新評(píng)估模型是對(duì)舊評(píng)估模型的一次優(yōu)化和全面化,在總體方向上、細(xì)節(jié)上和全面性上均滿足了電視劇熱度評(píng)估的需要。更為重要的是,新評(píng)估模型運(yùn)用幾何方法,形象地將電視劇熱度展現(xiàn)在幾何圖形中,并且化靜態(tài)為動(dòng)態(tài),構(gòu)建了電視劇熱度的實(shí)時(shí)評(píng)估體系。

          本站(databaseit.com)部分圖文轉(zhuǎn)自網(wǎng)絡(luò),刊登本文僅為傳播信息之用,絕不代表贊同其觀點(diǎn)或擔(dān)保其真實(shí)性。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益,請(qǐng)作者持權(quán)屬證明與本網(wǎng)聯(lián)系(底部郵箱),我們將及時(shí)更正、刪除,謝謝

          - END -
          • 相關(guān)文章