Chấp nhận dữ liệu thích: cách doanh nghiệp học cách kiếm lợi từ dữ liệu lớn

Bằng cách phân tích dữ liệu lớn, các công ty học cách khám phá các mẫu ẩn, cải thiện hiệu suất kinh doanh của họ. Hướng đi là thời thượng, nhưng không phải ai cũng có thể hưởng lợi từ dữ liệu lớn do thiếu văn hóa làm việc với chúng

“Tên của một người càng phổ biến thì khả năng họ thanh toán đúng hạn càng cao. Ngôi nhà của bạn càng có nhiều tầng, theo thống kê, bạn càng là người vay tốt hơn. Stanislav Duzhinsky, nhà phân tích tại Ngân hàng Home Credit, cho biết về những kiểu hành vi bất ngờ trong hành vi của người đi vay, dấu hiệu của cung hoàng đạo hầu như không ảnh hưởng đến khả năng được hoàn lại tiền, nhưng tâm lý thì có ảnh hưởng đáng kể. Anh ấy không cam kết giải thích nhiều mẫu trong số này – chúng được tiết lộ bởi trí tuệ nhân tạo, thứ đã xử lý hàng nghìn hồ sơ khách hàng.

Đây là sức mạnh của phân tích dữ liệu lớn: bằng cách phân tích một lượng lớn dữ liệu phi cấu trúc, chương trình có thể khám phá ra nhiều mối tương quan mà nhà phân tích khôn ngoan nhất của con người cũng không biết. Bất kỳ công ty nào cũng có một lượng lớn dữ liệu phi cấu trúc (dữ liệu lớn) – về nhân viên, khách hàng, đối tác, đối thủ cạnh tranh, có thể được sử dụng vì lợi ích kinh doanh: cải thiện hiệu quả của các chương trình khuyến mãi, tăng trưởng doanh số bán hàng, giảm doanh thu của nhân viên, v.v.

Những người đầu tiên làm việc với dữ liệu lớn là các công ty viễn thông và công nghệ lớn, các tổ chức tài chính và bán lẻ, Rafail Miftakhov, giám đốc của Tập đoàn Tích hợp Công nghệ Deloitte, CIS, nhận xét. Bây giờ có sự quan tâm đến các giải pháp như vậy trong nhiều ngành công nghiệp. Các công ty đã đạt được những gì? Và có phải phân tích dữ liệu lớn luôn dẫn đến kết luận có giá trị?

Không phải là một tải dễ dàng

Các ngân hàng sử dụng thuật toán dữ liệu lớn chủ yếu để cải thiện trải nghiệm của khách hàng và tối ưu hóa chi phí, cũng như để quản lý rủi ro và chống gian lận. Duzhinsky nói: “Trong những năm gần đây, một cuộc cách mạng thực sự đã diễn ra trong lĩnh vực phân tích dữ liệu lớn. “Việc sử dụng máy học cho phép chúng tôi dự đoán xác suất vỡ nợ chính xác hơn nhiều – tỷ lệ nợ quá hạn trong ngân hàng của chúng tôi chỉ là 3,9%.” Để so sánh, kể từ ngày 1 tháng 2019 năm 90, tỷ lệ các khoản vay quá hạn thanh toán trên 5 ngày đối với các khoản vay cấp cho cá nhân, theo Ngân hàng Trung ương, là XNUMX%.

Ngay cả các tổ chức tài chính vi mô cũng bối rối trước việc nghiên cứu dữ liệu lớn. Andrey Ponomarev, Giám đốc điều hành của Webbankir, một nền tảng cho vay trực tuyến, cho biết: “Ngày nay, việc cung cấp các dịch vụ tài chính mà không phân tích dữ liệu lớn giống như làm toán mà không có các con số. “Chúng tôi phát hành tiền trực tuyến mà không cần nhìn thấy khách hàng hoặc hộ chiếu của anh ta, và không giống như cho vay truyền thống, chúng tôi không chỉ phải đánh giá khả năng thanh toán của một người mà còn phải xác định tính cách của anh ta.”

Giờ đây, cơ sở dữ liệu của công ty lưu trữ thông tin về hơn 500 nghìn khách hàng. Mỗi ứng dụng mới được phân tích với dữ liệu này trong khoảng 800 tham số. Chương trình không chỉ tính đến giới tính, tuổi tác, tình trạng hôn nhân và lịch sử tín dụng mà còn tính đến thiết bị mà một người truy cập vào nền tảng, cách anh ta cư xử trên trang web. Ví dụ, có thể đáng báo động nếu một người vay tiềm năng không sử dụng máy tính khoản vay hoặc không hỏi về các điều khoản của khoản vay. Ponomarev giải thích: “Ngoại trừ một số yếu tố dừng – chẳng hạn như chúng tôi không cấp khoản vay cho những người dưới 19 tuổi – không có thông số nào trong số này tự nó là lý do để từ chối hoặc đồng ý cho vay,” Ponomarev giải thích. Đó là sự kết hợp của các yếu tố quan trọng. Trong 95% trường hợp, quyết định được đưa ra tự động mà không cần sự tham gia của các chuyên gia từ bộ phận bảo lãnh phát hành.

Cung cấp dịch vụ tài chính mà không phân tích dữ liệu lớn ngày nay giống như làm toán mà không có số.

Phân tích dữ liệu lớn cho phép chúng tôi rút ra các mẫu thú vị, Ponomarev chia sẻ. Ví dụ: người dùng iPhone hóa ra là những người vay có kỷ luật hơn so với chủ sở hữu thiết bị Android – thiết bị trước đây nhận được sự chấp thuận của các ứng dụng thường xuyên hơn 1,7 lần. Ponomarev nói: “Thực tế là quân nhân không trả nợ thường xuyên ít hơn gần một phần tư so với người vay trung bình không phải là điều ngạc nhiên. “Nhưng sinh viên thường không bị bắt buộc, nhưng trong khi đó, các trường hợp vỡ nợ tín dụng ít phổ biến hơn 10% so với mức trung bình của cơ sở.”

Việc nghiên cứu dữ liệu lớn cũng cho phép chấm điểm cho các công ty bảo hiểm. Được thành lập vào năm 2016, IDX tham gia vào việc nhận dạng từ xa và xác minh tài liệu trực tuyến. Các dịch vụ này đang được các công ty bảo hiểm vận chuyển hàng hóa yêu cầu, những người quan tâm đến việc tổn thất hàng hóa càng ít càng tốt. Jan Sloka, giám đốc thương mại của IDX, giải thích trước khi bảo hiểm vận chuyển hàng hóa, với sự đồng ý của người lái xe, công ty bảo hiểm sẽ kiểm tra độ tin cậy. Cùng với một đối tác – công ty St. Petersburg “Kiểm soát rủi ro” – IDX đã phát triển một dịch vụ cho phép bạn kiểm tra danh tính của tài xế, dữ liệu hộ chiếu và các quyền, tham gia vào các sự cố liên quan đến mất mát hàng hóa, v.v. Sau khi phân tích cơ sở dữ liệu về các tài xế, công ty đã xác định được một “nhóm rủi ro”: thất lạc hàng hóa thường xảy ra nhất ở những tài xế trong độ tuổi 30–40 có kinh nghiệm lái xe lâu năm, những người gần đây thường xuyên thay đổi công việc. Nó cũng chỉ ra rằng hàng hóa thường bị đánh cắp bởi những người lái xe ô tô, thời hạn sử dụng vượt quá tám năm.

Tìm kiếm

Các nhà bán lẻ có một nhiệm vụ khác – xác định những khách hàng sẵn sàng mua hàng và xác định những cách hiệu quả nhất để đưa họ đến trang web hoặc cửa hàng. Để đạt được điều này, các chương trình sẽ phân tích hồ sơ khách hàng, dữ liệu từ tài khoản cá nhân của họ, lịch sử mua hàng, truy vấn tìm kiếm và việc sử dụng điểm thưởng, nội dung của các giỏ điện tử mà họ bắt đầu điền và bỏ qua. Kirill Ivanov, giám đốc văn phòng dữ liệu của nhóm M.Video-Eldorado cho biết, phân tích dữ liệu cho phép bạn phân đoạn toàn bộ cơ sở dữ liệu và xác định các nhóm người mua tiềm năng có thể quan tâm đến một ưu đãi cụ thể.

Ví dụ: chương trình xác định các nhóm khách hàng, mỗi nhóm thích các công cụ tiếp thị khác nhau – khoản vay không lãi suất, tiền hoàn lại hoặc mã khuyến mãi giảm giá. Những người mua này nhận được một bản tin email với chương trình khuyến mãi tương ứng. Ivanov lưu ý rằng xác suất một người sau khi mở bức thư sẽ truy cập trang web của công ty, trong trường hợp này tăng lên đáng kể.

Phân tích dữ liệu cũng cho phép bạn tăng doanh số bán các sản phẩm và phụ kiện liên quan. Hệ thống đã xử lý lịch sử đặt hàng của các khách hàng khác, đưa ra các đề xuất cho người mua về những thứ nên mua cùng với sản phẩm đã chọn. Theo Ivanov, thử nghiệm phương pháp làm việc này cho thấy số lượng đơn đặt hàng có phụ kiện tăng 12% và doanh thu phụ kiện tăng 15%.

Các nhà bán lẻ không phải là những người duy nhất nỗ lực cải thiện chất lượng dịch vụ và tăng doanh thu. Mùa hè năm ngoái, MegaFon đã ra mắt dịch vụ ưu đãi “thông minh” dựa trên việc xử lý dữ liệu từ hàng triệu người đăng ký. Sau khi nghiên cứu hành vi của họ, trí tuệ nhân tạo đã học cách hình thành các ưu đãi cá nhân cho từng khách hàng trong phạm vi biểu giá. Ví dụ: nếu chương trình lưu ý rằng một người đang tích cực xem video trên thiết bị của anh ta, thì dịch vụ sẽ đề nghị anh ta mở rộng lưu lượng truy cập trên thiết bị di động. Có tính đến sở thích của người dùng, công ty cung cấp cho người đăng ký lưu lượng truy cập không giới hạn cho các loại hình giải trí trên Internet yêu thích của họ – ví dụ: sử dụng trình nhắn tin tức thì hoặc nghe nhạc trên các dịch vụ phát trực tuyến, trò chuyện trên mạng xã hội hoặc xem chương trình TV.

Vitaly Shcherbakov, giám đốc phân tích dữ liệu lớn tại MegaFon giải thích: “Chúng tôi phân tích hành vi của người đăng ký và hiểu sở thích của họ đang thay đổi như thế nào. “Ví dụ: năm nay, lưu lượng truy cập AliExpress đã tăng gấp 1,5 lần so với năm ngoái và nhìn chung, số lượt truy cập vào các cửa hàng quần áo trực tuyến đang tăng: 1,2–2 lần, tùy thuộc vào tài nguyên cụ thể.”

Một ví dụ khác về công việc của một nhà điều hành với dữ liệu lớn là nền tảng MegaFon Poisk để tìm kiếm trẻ em và người lớn mất tích. Hệ thống phân tích những người có thể ở gần nơi người mất tích và gửi cho họ thông tin kèm theo ảnh và dấu hiệu của người mất tích. Nhà điều hành đã phát triển và thử nghiệm hệ thống cùng với Bộ Nội vụ và tổ chức Lisa Alert: trong vòng hai phút kể từ khi định hướng cho người mất tích, hơn 2 nghìn người đăng ký nhận được, điều này làm tăng đáng kể cơ hội có kết quả tìm kiếm thành công.

Đừng đến quán rượu

Phân tích dữ liệu lớn cũng đã tìm thấy ứng dụng trong công nghiệp. Ở đây nó cho phép bạn dự báo nhu cầu và lập kế hoạch bán hàng. Vì vậy, trong nhóm các công ty Cherkizovo, ba năm trước, một giải pháp dựa trên SAP BW đã được triển khai, cho phép bạn lưu trữ và xử lý tất cả thông tin bán hàng: giá cả, chủng loại, số lượng sản phẩm, khuyến mãi, kênh phân phối, Vladislav Belyaev, CIO cho biết của nhóm Cherkizovo. Việc phân tích 2 TB thông tin tích lũy không chỉ giúp hình thành các loại và tối ưu hóa danh mục sản phẩm một cách hiệu quả mà còn tạo điều kiện thuận lợi cho công việc của nhân viên. Ví dụ: chuẩn bị báo cáo bán hàng hàng ngày sẽ yêu cầu nhiều nhà phân tích làm việc trong một ngày – hai người cho mỗi phân khúc sản phẩm. Bây giờ báo cáo này được lập bởi robot, chỉ dành 30 phút cho tất cả các phân đoạn.

Stanislav Meshkov, Giám đốc điều hành của Umbrella IT cho biết: “Trong ngành, dữ liệu lớn hoạt động hiệu quả cùng với Internet vạn vật. “Dựa trên phân tích dữ liệu từ các cảm biến mà thiết bị được trang bị, có thể xác định các sai lệch trong hoạt động của thiết bị và ngăn ngừa sự cố cũng như dự đoán hiệu suất.”

Ở Severstal, với sự trợ giúp của dữ liệu lớn, họ cũng đang cố gắng giải quyết những nhiệm vụ khá tầm thường – chẳng hạn như giảm tỷ lệ thương tật. Năm 2019, công ty đã phân bổ khoảng 1,1 tỷ RUB cho các biện pháp cải thiện an toàn lao động. Severstal kỳ vọng sẽ giảm tỷ lệ thương tật vào năm 2025 xuống 50% (so với năm 2017). “Nếu một người quản lý dây chuyền - quản đốc, quản lý công trường, quản lý cửa hàng - nhận thấy rằng một nhân viên thực hiện một số thao tác không an toàn (không bám vào tay vịn khi leo cầu thang tại khu công nghiệp hoặc không mặc tất cả các thiết bị bảo hộ cá nhân), anh ta viết ra một lưu ý đặc biệt dành cho anh ấy – PAB (từ “kiểm toán bảo mật hành vi”),” Boris Voskresensky, trưởng bộ phận phân tích dữ liệu của công ty cho biết.

Sau khi phân tích dữ liệu về số lượng PAB ở một trong các bộ phận, các chuyên gia của công ty nhận thấy rằng các quy tắc an toàn thường bị vi phạm nhất bởi những người đã có một số nhận xét trước đó, cũng như những người đang nghỉ ốm hoặc đi nghỉ ngay trước đó. sự việc. Các vi phạm trong tuần đầu tiên sau khi trở về từ kỳ nghỉ hoặc nghỉ ốm cao gấp đôi so với các tuần tiếp theo: 1 so với 0,55%. Nhưng hóa ra, làm việc vào ca đêm không ảnh hưởng đến số liệu thống kê của PAB.

Mất liên lạc với thực tế

Đại diện công ty cho biết việc tạo ra các thuật toán để xử lý dữ liệu lớn không phải là phần khó khăn nhất. Khó khăn hơn nhiều để hiểu làm thế nào các công nghệ này có thể được áp dụng trong bối cảnh của từng doanh nghiệp cụ thể. Đây chính là điểm yếu của các nhà phân tích công ty và thậm chí cả các nhà cung cấp bên ngoài, những nhà cung cấp dường như đã tích lũy chuyên môn trong lĩnh vực dữ liệu lớn.

Sergey Kotik, giám đốc phát triển của GoodsForecast cho biết: “Tôi thường gặp các nhà phân tích dữ liệu lớn là những nhà toán học xuất sắc nhưng lại không có hiểu biết cần thiết về quy trình kinh doanh. Anh nhớ lại cách đây hai năm, công ty của anh có cơ hội tham gia cuộc thi dự báo nhu cầu cho một chuỗi bán lẻ liên bang. Một khu vực thử nghiệm đã được chọn cho tất cả hàng hóa và cửa hàng mà những người tham gia dự đoán. Các dự báo sau đó được so sánh với doanh số bán hàng thực tế. Vị trí đầu tiên thuộc về một trong những gã khổng lồ Internet của Nga, được biết đến với chuyên môn về máy học và phân tích dữ liệu: trong các dự báo của mình, nó cho thấy độ lệch tối thiểu so với doanh số bán hàng thực tế.

Nhưng khi mạng bắt đầu nghiên cứu chi tiết hơn các dự báo của anh ấy, thì hóa ra từ quan điểm kinh doanh, chúng hoàn toàn không thể chấp nhận được. Công ty đã giới thiệu một mô hình tạo ra các kế hoạch bán hàng với cách diễn đạt có hệ thống. Chương trình đã tìm ra cách giảm thiểu xác suất sai sót trong dự báo: sẽ an toàn hơn nếu đánh giá thấp doanh số bán hàng, vì sai số tối đa có thể là 100% (không có doanh số âm), nhưng theo hướng dự đoán quá mức, nó có thể lớn tùy ý, Kotik giải thích. Nói cách khác, công ty đã trình bày một mô hình toán học lý tưởng, trong điều kiện thực tế sẽ dẫn đến tình trạng các cửa hàng bán trống một nửa và tổn thất lớn do bán hàng dưới giá. Kết quả là, một công ty khác đã giành chiến thắng trong cuộc cạnh tranh, những tính toán của họ có thể được áp dụng vào thực tế.

“Có thể” thay vì dữ liệu lớn

Các công nghệ dữ liệu lớn có liên quan đến nhiều ngành, nhưng việc triển khai tích cực của chúng không diễn ra ở mọi nơi, Meshkov lưu ý. Ví dụ, trong lĩnh vực chăm sóc sức khỏe, có một vấn đề về lưu trữ dữ liệu: rất nhiều thông tin đã được tích lũy và được cập nhật thường xuyên, nhưng phần lớn dữ liệu này vẫn chưa được số hóa. Cũng có nhiều dữ liệu trong các cơ quan chính phủ, nhưng chúng không được kết hợp thành một cụm chung. Chuyên gia này cho biết, việc xây dựng nền tảng thông tin thống nhất của Hệ thống quản lý dữ liệu quốc gia (NCMS) là nhằm giải quyết vấn đề này.

Tuy nhiên, đất nước của chúng tôi không phải là quốc gia duy nhất mà trong hầu hết các tổ chức, các quyết định quan trọng được đưa ra trên cơ sở trực giác chứ không phải phân tích dữ liệu lớn. Vào tháng 500 năm ngoái, Deloitte đã thực hiện một cuộc khảo sát với hơn một nghìn nhà lãnh đạo của các công ty lớn của Mỹ (với số lượng nhân viên từ 63 người trở lên) và nhận thấy rằng 37% những người được khảo sát đã quen thuộc với công nghệ dữ liệu lớn, nhưng không có tất cả những điều cần thiết. cơ sở hạ tầng để sử dụng chúng. Trong khi đó, trong số 12% công ty có mức độ thuần thục về phân tích cao, gần một nửa đã vượt mục tiêu kinh doanh đáng kể trong XNUMX tháng qua.

Nghiên cứu cho thấy ngoài khó khăn trong việc triển khai các giải pháp kỹ thuật mới, một vấn đề quan trọng ở các công ty là thiếu văn hóa làm việc với dữ liệu. Bạn không nên mong đợi kết quả tốt nếu trách nhiệm đối với các quyết định được đưa ra trên cơ sở dữ liệu lớn chỉ được giao cho các nhà phân tích của công ty chứ không phải cho toàn bộ công ty nói chung. Miftakhov nói: “Bây giờ các công ty đang tìm kiếm các trường hợp sử dụng thú vị cho dữ liệu lớn. “Đồng thời, việc thực hiện một số kịch bản đòi hỏi phải đầu tư vào hệ thống thu thập, xử lý và kiểm soát chất lượng dữ liệu bổ sung chưa được phân tích trước đó.” Than ôi, “phân tích vẫn chưa phải là một môn thể thao đồng đội,” các tác giả của nghiên cứu thừa nhận.

Chấp nhận dữ liệu tương tự: cách doanh nghiệp học cách thu lợi nhuận từ dữ liệu lớn

Bình luận