婷婷五月日韩av永久免费,国产精品日本一区,久久久久久国产精品mv,老色鬼欧美精品

職稱論文咨詢網(wǎng),專業(yè)提供留學(xué)生論文、職稱發(fā)表論文等各類論文學(xué)術(shù)咨詢服務(wù)的論文網(wǎng)站。

當(dāng)前位置:首頁 > 論文百科

基于文本聚類與情感分析的群租房微博輿情量化研究-經(jīng)濟(jì)職稱論文發(fā)表范文

來源:職稱論文咨詢網(wǎng)發(fā)布時(shí)間:2022-06-05 21:22:55
摘要[目的/意義]作為城市化進(jìn)程中的“頑疾”,群租房屢禁不止,群租房引發(fā)的社會(huì)問題層出不窮。這一系列問題引發(fā)了微博熱議,群租房微博輿情文本分析有助于獲悉群租房存在的問題,從受眾角度探討政府群租房治理成效。[方法/過程]利用網(wǎng)絡(luò)大數(shù)據(jù)爬取與分析技術(shù),以群租房為研究對(duì)象,通過文本聚類分析與情感分析,進(jìn)行熱點(diǎn)評(píng)估,補(bǔ)充現(xiàn)有文獻(xiàn)中忽視的群租房治理輿論研究。[結(jié)果/結(jié)論]研究發(fā)現(xiàn),微博網(wǎng)民對(duì)群租房話題的關(guān)注明顯呈波動(dòng)趨勢,討論話題主要包括群租房產(chǎn)生的社會(huì)問題、政府對(duì)群租房的整治行動(dòng)評(píng)價(jià)以及透過群租房現(xiàn)象折射出的中低收入群體的焦慮感。大多數(shù)微博網(wǎng)民在輿論場中的情感趨勢為負(fù)面,認(rèn)為有必要對(duì)群租房展開治理。本文的創(chuàng)新之處在于分析政府治理群租房所面對(duì)的輿論環(huán)境,并將其可視化呈現(xiàn),為政府深入了解民情,制定適應(yīng)民意的政策作鋪墊。   關(guān)鍵詞:群租房,社會(huì)輿情,文本聚類,情感分析   1引言   微博作為Web2.0時(shí)代的產(chǎn)物,為人們發(fā)布信息、發(fā)表觀點(diǎn)提供了較為自由的社交場景。輿情(PublicOpinion)即公眾輿論,是指公眾對(duì)于各種社會(huì)現(xiàn)象、問題從信念、態(tài)度、意見和情緒等角度所作出的表達(dá)[1]。微博作為重要的輿論場,諸多社會(huì)問題均在微博中得以反應(yīng)。我國城市化的快速發(fā)展促使大批非城市戶籍人口涌入城市。大城市因其豐富的就業(yè)機(jī)會(huì)和資源吸引大量外來務(wù)工人員,然而,一線城市高昂的生活成本成為困擾他們的難題之一。   為降低居住成本,他們紛紛選擇群租方式,群租房亦日漸成為大都市生活形態(tài)中一個(gè)揮之不去的組成部分,“蝸居”、“鴿子籠”、“房中房”成為大城市居住空間中的一種新形態(tài)。不容忽視的是,在享受群租房低廉租金的同時(shí),外來人員還必須面對(duì)群租所帶來的一系列安全風(fēng)險(xiǎn)。而每一起突發(fā)事件都會(huì)成為輿情爆點(diǎn),引發(fā)人們的熱烈探討。群租房作為社區(qū)管理的重大隱患之一,迫切需要政府采取有效措施加以規(guī)范與管理。不過從實(shí)踐效果來看,群租房治理卻陷入困境。   北京、上海、廣州等國內(nèi)一線城市紛紛出臺(tái)出租房屋條例和規(guī)定,限制乃至取締群租。政府各部門也先后多次開展集中整治群租房行動(dòng)。各地政府的每一次整治行為便會(huì)引發(fā)社會(huì)媒體的廣泛關(guān)注。然而,面對(duì)眾多的自媒體討論,要全面了解民眾對(duì)群租房的看法與態(tài)度存在諸多挑戰(zhàn)。圍繞群租房整治行動(dòng),一部分群體抨擊政府整治行動(dòng)的強(qiáng)硬、粗暴,忽視弱勢群體利益,而另一部分群體又強(qiáng)烈支持政府各項(xiàng)整治行動(dòng)以消除群租房帶來的社會(huì)風(fēng)險(xiǎn)。目前圍繞群租房整體輿論趨勢的研究鮮有學(xué)者涉及。因此,本文期望利用大數(shù)據(jù)爬取技術(shù),對(duì)社交領(lǐng)域使用用戶最多的新浪微博中關(guān)于群租房的討論進(jìn)行爬取,并借助文本聚類分析和情感分析整體分析網(wǎng)絡(luò)輿情,探尋治理群租房所面臨的宏觀輿論環(huán)境。   2群租房問題與微博輿情文獻(xiàn)綜述   截至目前,學(xué)者已經(jīng)對(duì)群租房相關(guān)問題進(jìn)行大量研究,主要研究群租房概念、群租房產(chǎn)生的問題以及群租房治理對(duì)策等。目前比較一致的觀點(diǎn)認(rèn)為群租是一種租賃關(guān)系[2]。群租雖然為大城市低收入階層提供了居住場所,但無序的群租行為也帶來大量的治理問題。學(xué)者對(duì)于群租房引發(fā)的問題探討主要集中在群租房引起的社會(huì)安全[3]、消防安全[4-8]、鄰里矛盾[9]、物業(yè)管理困難[10-11]等方面。面對(duì)群租帶來的一系列治理問題,實(shí)務(wù)界和學(xué)界對(duì)群租房的治理路徑也進(jìn)行了探析。   從政府實(shí)際行為看,運(yùn)動(dòng)式治理是政府治理群租房的主要手段[6,12]。但運(yùn)動(dòng)式治理面臨著治理成本高、效率低,難以達(dá)到根治效果[15]。從學(xué)者們的建議看,多中心治理[13]、協(xié)同治理[14]是治理群租房較有效的方式。雖然學(xué)者已經(jīng)意識(shí)到群租房存在的社會(huì)問題,并探討了群租房治理方式,但是,目前還沒有學(xué)者對(duì)群租房輿情進(jìn)行過研究。黑格爾曾言“無論哪個(gè)時(shí)代,公共輿論總是一支巨大的力量”,微博輿情可以較大程度的反映民眾心聲,是政府治理不可忽視的重要部分。民眾對(duì)群租房治理問題持怎樣的態(tài)度、觀點(diǎn),直接影響著群租房治理成效。   目前,學(xué)者對(duì)微博輿情的研究多集中在新聞傳播、管理學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域。計(jì)算機(jī)科學(xué)領(lǐng)域?qū)ξ⒉┹浨槲谋痉治龅难芯慷嗍且运惴橹螢槲⒉┹浨樾畔@取[15]、關(guān)鍵詞提取[16]、文本聚類[17]、情感分析[18]、輿情可視化[19-20]等提供方法論基礎(chǔ),本文是建立在這些方法基礎(chǔ)之上的。對(duì)群租房問題引發(fā)的輿情的研究鮮有學(xué)者涉及,微博輿情文本分析及其可視化方法已日漸成熟。   基于既定熱點(diǎn)“群租房”進(jìn)行的微博輿情文本分析也是一種新的研究視角和研究問題。將文本聚類、微博輿情分析方法運(yùn)用到對(duì)群租房微博輿情的分析中既是將微博輿情文本分析方法用于公共治理研究的有益實(shí)踐,也拓展了研究途徑,豐富了群租房治理問題的研究方法。   3數(shù)據(jù)基礎(chǔ)與研究方法   3.1數(shù)據(jù)獲取   本文利用網(wǎng)絡(luò)數(shù)據(jù)爬取技術(shù)提取微博輿情數(shù)據(jù),挖掘社會(huì)民眾對(duì)群租房治理的態(tài)度,嘗試分析群租房治理過程中展現(xiàn)出來的社會(huì)輿論特點(diǎn),建構(gòu)治理的輿論大背景。微博輿情數(shù)據(jù)具體搜集情況如下:雖然新浪微博提供了開放的API,但是其提供的API當(dāng)中的話題搜索高級(jí)API,能夠搜索到的微博信息只有503條,并不滿足研究的需求。故我們采用自行爬取的方法對(duì)微博平臺(tái)進(jìn)行關(guān)鍵字的爬取。   本文通過使用Python開源框架Scrapy,以“群租房”為關(guān)鍵詞,采用深度優(yōu)先的策略對(duì)網(wǎng)頁數(shù)據(jù)進(jìn)行爬取,以下是爬取關(guān)鍵字的偽代碼:Begindefcrawler_key_words(key_words):Getpage_dataGeturlsIfmatch(key_words)   crawler_key_words(key_words)End在爬取過程中遇到了三個(gè)問題:(1)微博需要登錄后才能瀏覽相應(yīng)的搜索結(jié)果;(2)微博設(shè)置了搜索結(jié)果顯示的上限,限定為1000條,而與群租房有關(guān)的微博數(shù)量超過十萬條;(3)微博的Web端采用了動(dòng)態(tài)獲取的方式加載信息,加大了信息獲取難度。為解決這三大問題,我們采取了以下應(yīng)對(duì)措施。針對(duì)登錄問題,我們采用模擬登錄的方式解決。一般而言,模擬登錄有兩種方式:一是在程序中向網(wǎng)站發(fā)出登錄請(qǐng)求,也就是提交包含登錄信息的表單(用戶名、密碼等),然后從響應(yīng)中得到Cookie,以后在訪問其他頁面時(shí)也帶上這個(gè)Cookie,這種方式可以打開只有登錄后才能看到的頁面。   但是該也會(huì)遇到諸如反爬加密、驗(yàn)證碼等一系列復(fù)雜而且麻煩的問題。第二種方式是使用無頭瀏覽器訪問,在Python中可以使用Selenium庫來調(diào)用瀏覽器,從而達(dá)到模擬人為登錄的操作,登錄之后獲取到Cookie就能進(jìn)行爬取工作??紤]到第一種方式的弊端,本文采取了第二種方式進(jìn)行模擬登錄。   針對(duì)微博搜索上限限定的問題,實(shí)際處理中采用高級(jí)搜索功能,按照時(shí)間跨度進(jìn)行搜索。將時(shí)間跨度調(diào)整到適當(dāng)?shù)拇笮?,使得每次搜索顯示的條數(shù)在1000條以內(nèi),通過對(duì)不同時(shí)間跨度的搜索,得到所有的微博信息。針對(duì)微博動(dòng)態(tài)加載問題,通過采取爬取微博Wap端,而不是Web端來解決。微博的Wap端沒有采用動(dòng)態(tài)加載的方式,可以直接獲取所有的微博信息。通過以上解決方案,我們能夠利用Python對(duì)新浪微博進(jìn)行關(guān)鍵詞爬取。   但自2018年開始,微博的反爬機(jī)制會(huì)自動(dòng)識(shí)別爬蟲程序,對(duì)爬取所用的賬號(hào)甚至是IP限制訪問,因此每次爬取速度不宜過快。再加上在爬取的過程中,也有一定概率被識(shí)別成爬蟲,需要重新定向到登錄頁面。這都導(dǎo)致對(duì)微博爬取的過程耗時(shí)長,成功率較低。鑒于以上情況,我們爬取了2011至2018年所有時(shí)間段的部分?jǐn)?shù)據(jù),重點(diǎn)針對(duì)北京群租房大火事件等一些特殊時(shí)間節(jié)點(diǎn)進(jìn)行了多次爬取。最終成功獲取了2011年至2018年1月以“群租房”為關(guān)鍵字的16294條微博信息,作為后續(xù)研究的輿情數(shù)據(jù)。   3.2研究方法   本文主要采用R語言分析工具進(jìn)行微博輿情分析。隨著R版本的逐漸成熟和穩(wěn)定,R在行業(yè)里的應(yīng)用得到了飛速發(fā)展。R語言可在Windows、MacOS、Linux等多種操作系統(tǒng)使用,擁有強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化效果。實(shí)驗(yàn)中運(yùn)用R主要進(jìn)行中文文本分析,包括聚類分析與情感分析[21]。   3.2.1文本聚類分析   聚類分析是指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過程,目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類的各指標(biāo)之間具有一定的相關(guān)關(guān)系,常見的聚類有層次聚類與非層次聚類。本文的聚類主要是利用R語言結(jié)合K-means算法對(duì)中文分詞之后的詞語進(jìn)行主題詞聚類,挖掘分詞之間的共現(xiàn)關(guān)系。中文分詞主要利用R語言編程軟件,主要利用開源包jiebaR中的segment函數(shù)對(duì)文本進(jìn)行分詞,并利用tibble包的as_data_frame函數(shù)將分詞了的文本轉(zhuǎn)化為標(biāo)準(zhǔn)化格式,以備后期文本聚類分析使用。   4群租房輿情分析   自媒體時(shí)代,微博為公眾賦予了充分的話語權(quán),微博也因其獨(dú)有的便攜性、匿名性和共享自由成為網(wǎng)絡(luò)輿情的重要發(fā)源地[23]。對(duì)微博輿情的分析主要從三個(gè)方面進(jìn)行:(1)群租房微博數(shù)據(jù)處理和討論概況;(2)群租房微博文本內(nèi)容分析;(3)群租房微博情感分析。   4.1群租房微博數(shù)據(jù)處理和分布趨勢   利用網(wǎng)絡(luò)爬蟲技術(shù)對(duì)群租房信息進(jìn)行扒取,共獲得16294條數(shù)據(jù)。對(duì)爬取到的數(shù)據(jù)為空白的無效數(shù)據(jù)進(jìn)行刪除,對(duì)獲取數(shù)據(jù)的時(shí)間、ID、內(nèi)容等進(jìn)行篩選后的重復(fù)數(shù)據(jù)進(jìn)行刪除,共獲得14053條數(shù)據(jù)。為了了解群租房輿情熱點(diǎn)分布情況,對(duì)群租房微博數(shù)量按照月份進(jìn)行統(tǒng)計(jì)。   4.2群租房微博輿情內(nèi)容文本分析   為明確群租需求與群租社會(huì)問題的主要內(nèi)容,我們嘗試?yán)糜?jì)量工具R的詞頻統(tǒng)計(jì)和聚類功能對(duì)微博輿情中具體內(nèi)容進(jìn)行分析。   4.3微博文本情感分析   本文將2011-2018年的微博文本按月份進(jìn)行拆分,通過計(jì)算每個(gè)月的微博文本中正向情感詞與負(fù)向情感詞,對(duì)整月的文本情感貢獻(xiàn)的差值繪圖,得到2011-2018年微博文本的整體情感傾向,其中橫軸代表時(shí)間,從2011年1月至2018年1月共81個(gè)月,排列順序從1至81;縱軸表示情感傾向,數(shù)值等于積極情感詞數(shù)減去消極情感詞數(shù)。   從中可以看出,近八年來,公眾的情感差值基本維持在較負(fù)面消極的水平。導(dǎo)致這種現(xiàn)象的原因主要有三個(gè),一是大部分群租房都存在違法行為,政府取締群租房引發(fā)群租房群體的住房焦慮;二是群租房事故頻發(fā),給群租租房者、房東抑或是鄰里帶來很大困擾;三是長期以來有關(guān)群租房的負(fù)面新聞不斷,這使得公眾對(duì)群租房的整體印象較差。雖說公眾情感整體呈現(xiàn)較為負(fù)面的水平,但仍有部分月份呈現(xiàn)出積極的情感傾向,這多與政府的治理舉措有關(guān)。   政府在治理群租房的過程中并非僅僅是運(yùn)動(dòng)式搜索、取締,也會(huì)進(jìn)行諸如群租房整改、打擊黑中介、群租房安全知識(shí)宣傳與消防安全檢查等行為,這些行為本質(zhì)上對(duì)租客與業(yè)主雙向利好,因此會(huì)引發(fā)群眾積極的評(píng)論。除此之外,政府在整治群租房過程中并非只堵不疏,如2017年7月住建部等九部委下發(fā)了《關(guān)于在人口凈流入的大中城市加快發(fā)展住房租賃市場的通知》,積極推行租購?fù)瑱?quán)、試點(diǎn)商改租、大力治理群租房。這些舉措得到群眾較大支持,在圖中呈現(xiàn)出正面的情感傾向。   加快大中城市住房租賃市場發(fā)展讓更多底層人民租得起正常的住房更是解決群租房問題最根本的措施,獲得較多積極評(píng)價(jià)。政府對(duì)群租房的治理雖具有一定成效,但目前房租如房價(jià)一般居高不下,高額房租使他們不得不選擇群租房,群租房整體狀況仍舊堪憂,輿情整體呈現(xiàn)出較為負(fù)面的傾向。   5結(jié)論   本文利用R語言分析工具,結(jié)合詞頻分析、聚類分析和情感分析等方法,對(duì)北京市群租房的微博輿情狀況進(jìn)行了研究,討論了微博網(wǎng)民對(duì)群租房話題的關(guān)注度與情感傾向。通過研究發(fā)現(xiàn)2011-2018年網(wǎng)絡(luò)對(duì)群租房的關(guān)注呈波動(dòng)趨勢且與群租房熱點(diǎn)事件密切相關(guān),而2013、2014、2017年相關(guān)話題的討論最多,分析發(fā)現(xiàn)討論的具體話題包括群租房產(chǎn)生的社會(huì)安全、消防治安問題,政府對(duì)群租房的整治行動(dòng)與措施等,揭示出群租房背后反映的中低收入住房群體焦慮現(xiàn)狀。   通過情感分析發(fā)現(xiàn)網(wǎng)民雖然認(rèn)為群租房存在有其必然性,但由于群租房容易導(dǎo)致諸多安全隱患,所以大眾普遍認(rèn)為對(duì)群租房的整治也必不可少,其中民眾對(duì)政府的安全教育、消防檢查、發(fā)展租賃市場保障租戶權(quán)益等持支持態(tài)度。但整體而言,微博網(wǎng)民的情感趨勢為負(fù)向,反映出在這一治理領(lǐng)域基本的社會(huì)情緒。   本文的創(chuàng)新之處在于通過大數(shù)據(jù)爬取和R語言分析手段在宏觀層面分析政府治理群租房所面對(duì)的輿論環(huán)境,為政府開展治理行動(dòng)奠定輿論基礎(chǔ),增加政府對(duì)群租房治理的行動(dòng)信心,使政府行為真正成為民之所向。同時(shí)本文的分析方法也為群租房問題的研究提供了新的視角,有利于更全面地分析群租房問題。此外,本文仍存在一定的不足之處,文中對(duì)群租房微博輿情的分析僅對(duì)群租房折射出的社會(huì)問題、政府治理難題進(jìn)行了一定程度的分析,并對(duì)民眾對(duì)政府行為持積極態(tài)度的方面進(jìn)行了分析,但對(duì)于如何因地制宜治理群租房還需要全面深入的研究與探索。   參考文獻(xiàn):   [1]周金元,張莎莎.國內(nèi)微博輿情研究的文獻(xiàn)計(jì)量分析[J].圖書情報(bào)研究,2014,7(2):45-49.   [2]宋安成.禁止“群租”關(guān)鍵看執(zhí)法[N].房地產(chǎn)時(shí)報(bào),2007-01-29(A07).   [3]張孟佳,萬發(fā)文.“群租房”刑法屬性的實(shí)踐分析[J].上海公安高等??茖W(xué)校學(xué)報(bào),2013(2):82-85.   [4]郭駿峰.“群租房”建筑消防安全存在的問題及處置對(duì)策[J].門窗,2016(09):238.   [5]丁偉.淺談群租房的消防安全問題及管理對(duì)策[J].湖北科技學(xué)院學(xué)報(bào),2016(7):143-144.   [6]劉艷敏.群租房整治的反向思考[J].新安全東方消防,2008(9):72.   [7]王婷涵.淺談某轄區(qū)群租房消防安全突出問題及整治對(duì)策[J].消防技術(shù)與產(chǎn)品信息,2016(12):69-71.   [8]林震.對(duì)群租房相關(guān)消防安全問題的思考[J].消防技術(shù)與產(chǎn)品信息,2010(4):22-24.   相關(guān)刊物推薦:《消防技術(shù)與產(chǎn)品信息》(月刊)創(chuàng)刊于1988年,由中國消防協(xié)會(huì)主辦。本刊是一體集資料性、實(shí)用性、信息性為一體的專業(yè)雜志。其辦刊宗旨是:傳番消防學(xué)術(shù)研究成果,宣傳國內(nèi)外先進(jìn)消防技術(shù)和經(jīng)驗(yàn),及時(shí)溝通信息,為發(fā)展消防技術(shù),提高消防產(chǎn)品質(zhì)量,減少火災(zāi)損失服務(wù)。
相關(guān)閱讀
學(xué)術(shù)咨詢服務(wù)
?
桑日县| 白朗县| 安岳县| 万宁市| 灵台县| 咸阳市| 芮城县| 巴彦淖尔市| 来凤县| 固安县| 长垣县| 乌鲁木齐县| 海南省| 东乡| 新泰市| 伽师县| 乌兰察布市| 巢湖市| 西昌市| 阳城县| 高淳县| 兰溪市| 当涂县| 莱州市| 博兴县| 宝兴县| 临高县| 闽侯县| 芜湖市| 无为县| 体育| 双辽市| 方城县| 茂名市| 南阳市| 吉林市| 南召县| 开鲁县| 乌恰县| 修武县| 夏河县|