Nghiên cứu dữ liệu lớn Tang Thơ và Thơ bài hát Kết luận là đột phá

Sử dụng phân tích dữ liệu lớn: Tác phẩm của nhà thơ nhà ở Bai Juyi là tác phẩm đầu tiên nhưng ảnh hưởng đến các nhà thơ bài hát có ảnh hưởng nhất.

Sử dụng dữ liệu lớn để phân tích các bài thơ của các triều đại Tang và Song, và kết luận có thể vượt quá trí tưởng tượng của bạn -Bai Juyi, người đứng đầu về số lượng tác phẩm trong các nhà thơ nhà Tang, và ảnh hưởng của mười. Bangyan; Chỉ số ảnh hưởng toàn diện cho thấy Du Fu cao hơn Li Bai và Xin Qiji mạnh hơn Su Shi …

Những khám phá mới trên là các chuyên gia chính của dự án lớn của Quỹ Khoa học Xã hội quốc gia “Tang và Song văn học Biên tập thông tin thường niên Xây dựng” và Wang Zhaopeng, giáo sư của Trường Văn học và Báo chí của Đại học Tứ Xuyên, đã phân tích.

Thơ Tang là đỉnh cao đầu tiên trong lịch sử thơ Trung Quốc. Có hơn 50.000 bài thơ trong triều đại nhà rộng và hơn 3.000 nhà thơ. Các nhà thơ và bài thơ đã đạt đến mức độ chưa từng có. Có gần 1.500 nhà thơ trong Triều đại hát, với hơn 21.000 từ.

Từ quan điểm của các nhà thơ riêng lẻ, ai có nhiều tác phẩm nhất trong thơ và bài hát Tang? Dữ liệu lớn của Wang Zhaopeng cho thấy Bai Juyi được xếp hạng ở đầu số lượng tác phẩm của Tang Poetry, và những bài thơ là gần 3.000; Du Fu và Li Bai theo sát, với hơn một nghìn dấu. Trong bài hát CI, các từ của Xin Qiji được xếp hạng đầu tiên về số lượng, với hơn 600, tiếp theo là Su Shi và Liu Chenweng. Số lượng bài thơ được gọi bởi Lu You, với hơn 9.000 bài hát, tiếp theo là Liu Kezhuang và Yang Wanli.

Theo bảng xếp hạng của Chỉ số ảnh hưởng toàn diện, Du Fu là người đầu tiên trong ảnh hưởng của các nhà thơ nhà ở Tang, tiếp theo là Li Bai và Wang Wei, và Bai Juyi, người được xếp hạng đầu tiên về số lượng tác phẩm, được xếp hạng mười. Số lượng và ảnh hưởng của các nhà thơ triều đại hát là Xin Qiji, và Su Shi và Zhou Bangyan lần lượt xếp thứ hai và thứ ba. Su Shi, ảnh hưởng của thơ bài hát, là đỉnh của Su Shi, và Lu You, người đứng đầu tác phẩm của mình, theo sát.

Khi nói đến các bậc thầy nổi tiếng của thơ và bài hát, mọi người nói rằng “Li du” và “Su Xin” dường như còn hơn cả Du và Su Sheng với Xin. Tuy nhiên, chỉ số tác động toàn diện cho thấy Du Fu cao hơn Li Bai và Xin Qiji mạnh hơn Su Shi. Điều đáng ngạc nhiên hơn nữa là nhà thơ được tìm kiếm nhiều nhất không phải là Su và Xin và Zhou Bangyan. Trong số 100 và 300 bài hát, Zhou Bangyan chiếm mười lăm và bốn mươi bài hát, và phần này cao hơn nhiều so với Su và Xin.

Sử dụng dữ liệu khách quan để đo lường và phân tích đánh giá thơ khá chủ quan. Nó có khoa học và khả thi không? Trong một cuộc phỏng vấn độc quyền với Thanh niên Bắc Kinh hàng ngày, Wang Zhaopeng nhấn mạnh rằng mặc dù dữ liệu có thể mô tả sự phát triển và quá trình của lịch sử văn học ở một mức độ nhất định, nhưng cũng có những hạn chế rõ ràng.

Bắt đầu nghiên cứu 30 năm trước

Tích lũy hàng triệu dữ liệu

Câu hỏi: Ý định ban đầu của chủ đề “Thế giới của Tang và những bài thơ bằng dữ liệu lớn” là gì?

Trả lời: Tôi đã bắt đầu phân tích định lượng của các bài thơ Tang và bài hát vào năm 1992. Ý định ban đầu là tất cả mọi người đều có tên riêng của Tang và bài thơ. Bất cứ điều gì các bài thơ Tang và bài hát trong lịch sử được coi là bài báo nổi tiếng, tôi muốn sử dụng dữ liệu thống kê để phân tích và đo lường.

Câu hỏi: Làm thế nào để bạn sử dụng dữ liệu lớn để đo lường chất lượng của thơ Tang và bài hát? Làm thế nào để những dữ liệu này được tính?

Trả lời: Chất lượng của thơ hoạt động trong các triều đại Tang và Song chưa được tìm thấy được đánh giá và đo lường. Tôi hiện đang cố gắng xây dựng một hệ thống chỉ số đánh giá về chất lượng các tác phẩm văn học để thu thập dữ liệu. Điều này đòi hỏi một quá trình dài hơn. Ngoài ra, hệ thống chỉ số đánh giá được thiết lập bởi các cá nhân đòi hỏi sự công nhận và đồng thuận của cộng đồng học thuật.

Câu hỏi: Điều gì về tình trạng nghiên cứu hiện tại của thế giới học thuật?

RGNG B CH KIM ĐặC BIệT Trả lời: Dữ liệu tài liệu trong kỷ nguyên của dữ liệu lớn đòi hỏi hệ thống chỉ số để phân loại để thiết lập dữ liệu lịch sử văn học để đảm bảo độ tin cậy và tính hợp lệ của dữ liệu. Tuy nhiên, không có nhiều học giả sử dụng dữ liệu lớn để thực hiện nghiên cứu thơ Tang và thơ bài hát. Dữ liệu lớn của bài thơ thơ Tang và bài hát được chia sẻ cho các giới học thuật cũng khá hạn chế.

Từ năm 1992 đến nay, mặc dù tôi đã tích lũy được hơn một triệu dữ liệu liên quan đến thơ Tang và bài hát CI, nhưng nó không hoàn chỉnh và không đồng đều. Có nhiều dữ liệu hơn và ít dữ liệu hơn trong một số khoảng thời gian; một số loại dữ liệu này, một số dữ liệu; một số nhà thơ có nhiều dữ liệu hơn và một số nhà thơ có ít dữ liệu hơn. Chúng ta thường cảm thấy rằng “cuốn sách được sử dụng khi cuốn sách được sử dụng để sử dụng ít hơn” và dữ liệu thậm chí còn giống như thế này hơn. Khi phân tích các bài thơ Tang một cách toàn diện, tôi thường cảm thấy rằng dữ liệu là không đủ.

Theo tôi, hệ thống chỉ số đánh giá văn học nên được thiết lập bởi tác phẩm. Ảnh hưởng của người viết là tiền đề của ảnh hưởng của tác phẩm. Việc đánh giá tác phẩm có thể được chia thành hai chiều. Một là giá trị văn học bên trong của tác phẩm tương đối ổn định và phần còn lại là ảnh hưởng bên ngoài của các tác phẩm không sinh động. Giá trị văn học của nó có thể được xem xét từ hai cấp độ: nội dung và hình thức.

Ảnh hưởng của công việc được đo lường từ ba cấp độ của người sáng tạo, bình luận viên và độc giả bình thường.一 是 , , , , , 翻译 , , , , , , 的 的 的 的 的 和 和 和 和Danh tiếng và sự chú ý ở cấp độ nghiên cứu học thuật; thứ ba là mức độ truyền và nhận thức giữa những người đọc bình thường. Sau khi xác định giá trị của công việc, các yếu tố và cấu trúc cơ bản của tác động, sau đó xây dựng một mô hình điện toán, sau đó chạy bởi máy tính trong thư viện tài nguyên có liên quan, xác chết và mạng, khai quật và trích xuất dữ liệu liên quan và cuối cùng Điểm của mỗi công việc.

Dữ liệu không thể đo lường nội dung nghệ thuật

Và giá trị thẩm mỹ

Câu hỏi: Bạn đã đề cập trong chủ đề rằng theo thống kê, gần 600 năm từ triều đại Đông Hán đến cuối triều đại Sui, chỉ có hơn 5.000 thơ. kéo dài đến hơn 50.000. Thơ Tang đã tăng hơn bảy lần so với tám bài thơ phát triển trước đó, và các nhà thơ đã tăng từ hơn 600 lên hơn 3.000. Các nhà thơ và bài thơ đã đạt đến cường độ chưa từng có. Dữ liệu này đến từ đâu, bạn đề cập đến những tài liệu quan trọng nào? Trả lời: Dữ liệu đến từ hai bài báo của người bạn cũ của tôi, Giáo sư Shang Yongliang: “Phân tích định lượng của tám thế hệ phân phối thơ và xu hướng phát triển” và “Phân tích định lượng về hệ thống phân cấp của các nhà thơ Tang Zhiming và sự phát triển của Dai Guan”.

Câu hỏi: Làm thế nào để những bài thơ của Bai Juyi lớn nhất, nhưng ảnh hưởng nằm trong top mười. Làm thế nào điều này có thể được đánh giá?

Trả lời: Sử dụng dữ liệu. Chúng tôi đã sử dụng một loạt các dữ liệu để xếp hạng ảnh hưởng của các nhà thơ nhà ở Tang. Ảnh hưởng của Bai Juyi lớn hơn thời cổ đại trong thời hiện đại. Ảnh hưởng toàn diện của anh ấy ít hơn nhiều so với Li Bai và Du Fu.

Câu hỏi: Sau đó, cơ sở để đánh giá chất lượng của thơ Tang và bài hát CI thông qua dữ liệu lớn là gì?

Trả lời: Hiện tại, chỉ có thể sử dụng dữ liệu lớn để đo lường ảnh hưởng của thơ và thơ bài hát -bao gồm sự hấp dẫn của việc tạo ra các nhà thơ trong tương lai, danh tiếng của con cháu của hậu duệ và sự phổ biến giữa các tác giả thông thường. Hiện tại, dữ liệu không thể được sử dụng để đo lường nội dung nghệ thuật và giá trị thẩm mỹ của thơ Tang và thơ bài hát.

Trung tâm văn học trong triều đại đầu bài hát phía bắc

Chỉ cần di chuyển về phía nam

Câu hỏi: Sử dụng dữ liệu lớn để nghiên cứu xem có một số khó khăn trong học tập trong bài thơ Tang và bài hát hay không và làm thế nào để bạn vượt qua nó?

Trả lời: Nghiên cứu văn học chưa bao giờ nhận thức được dữ liệu. Khó khăn không chỉ là tìm dữ liệu, mà còn cả loại dữ liệu đang tìm kiếm. Loại dữ liệu nào hữu ích và hiệu quả, đòi hỏi cả hỗ trợ và kiểm tra lý thuyết trong thực tế. Về mặt lý thuyết, chúng tôi tiếp tục khám phá để tìm ra sự mặc khải của lý thuyết và phương pháp từ thống kê, tin học đo lường và lịch sử đo lường; trong thực tế, các bài kiểm tra lặp đi lặp lại, thất bại. Điều đau đớn nhất là cơ sở dữ liệu được xây dựng và bài viết đã được viết. Đột nhiên thấy rằng nguồn dữ liệu không đầy đủ, vì vậy tôi phải tạo ra dữ liệu ngay từ đầu và các bài viết được đẩy xuống một lần nữa.

Câu hỏi: Bạn có những khám phá mới nào khác trong nghiên cứu cụ thể về dữ liệu lớn?

Trả lời: Tầm quan trọng của dữ liệu không chỉ có thể xác nhận các kết luận truyền thống, mà còn sửa đổi các kết luận truyền thống. Các vấn đề mới có thể được phát hiện và nhận thức truyền thống có thể được thay đổi. Ví dụ, có một kết luận rõ ràng về văn hóa và địa lý Trung Quốc. Trung tâm văn hóa Trung Quốc đang dần di chuyển từ vùng đồng bằng trung tâm sang miền Nam. Đó là sự hỗn loạn của Jingkang trong triều đại của nhà hát. Ba cuộc chiến đã thúc đẩy phong trào phía nam của Trung tâm văn hóa. Sau sự hỗn loạn của Jingkang, trung tâm văn hóa hoàn toàn di chuyển về phía nam. Dữ liệu lớn của chúng tôi nhận thấy rằng Trung tâm Văn học đã hoàn toàn được chuyển đến miền Nam trong triều đại Song Song đầu tiên. Số lượng tác giả ở miền Nam đã vượt qua miền Bắc mà không chờ đợi sự hỗn loạn của Jingkang. Hơn nữa, chiến tranh không phải là yếu tố duy nhất để thúc đẩy miền Nam của trung tâm văn hóa.

Chúng tôi cũng thấy rằng trung tâm văn học của triều đại bài hát dần dần di chuyển về phía bờ biển phía đông nam. Theo thống kê của bộ phận hành chính ở tỉnh ngày nay, số lượng tác giả ở Nanping, Fujian trong triều đại Song, được xếp hạng đầu tiên và lần thứ hai ở Fuzhou đứng thứ hai. Điều này thật đáng ngạc nhiên. Liên quan đến điều này là số lượng các học giả trong triều đại Song là đầu tiên ở Fuzhou, và Nanping là thứ hai. Có thể thấy rằng Nanping và Fuzhou đã được phát triển vào thời điểm đó. Giáo dục và văn học rất tích cực.

Ngoài ra, chúng tôi cũng phát hiện ra rằng đỉnh cao của bài viết của Su Dongpo là ở Huangzhou. Một phần ba từ của ông được viết trong thời kỳ khấu hao của Huangzhou. Một nửa số kiệt tác nổi tiếng của ông được viết bằng Huangzhou. Ví dụ, bài viết đầu tiên của Song CI “Niannu Jiao · Chibi” được viết bằng Huangzhou. Huangzhou đã tạo nên vinh quang cho những lời của Su Shi. (Văn bản/phóng viên Zhang Enjie phối hợp/Liu Jianghua)