ვინ აგროვებს დიდ მონაცემებს და რატომ?

2019 წლის შემოდგომაზე Apple Card სერვისთან დაკავშირებით სკანდალი ატყდა: რეგისტრაციისას მან გასცა განსხვავებული საკრედიტო ლიმიტები მამაკაცებსა და ქალებზე. სტივ ვოზნიაკსაც კი არ გაუმართლა:

ერთი წლით ადრე გაირკვა, რომ Netflix პლატფორმა მომხმარებლებს უჩვენებს სხვადასხვა პოსტერებსა და ტიზერებს, მათი სქესის, ასაკისა და ეროვნების მიხედვით. ამისთვის სამსახური რასიზმში დაადანაშაულეს.

და ბოლოს, მარკ ცუკერბერგს რეგულარულად აკრიტიკებენ Facebook-ის მიერ მისი მომხმარებლების მონაცემების სავარაუდო შეგროვების, გაყიდვისა და მანიპულირების გამო. წლების განმავლობაში მას ადანაშაულებდნენ და ცდილობდნენ კიდეც ამერიკის არჩევნების დროს მანიპულირებაში, რუსეთის სპეცსამსახურების დახმარებაში, სიძულვილისა და რადიკალური შეხედულებების გაღვივებაში, არასათანადო რეკლამაში, მომხმარებლის მონაცემების გაჟონვაში, პედოფილების წინააღმდეგ გამოძიების შეფერხებაში.

ზუკის ფეისბუქის პოსტი

ამავდროულად, Pornhub ონლაინ სერვისი ყოველწლიურად აქვეყნებს ანგარიშებს, თუ რა სახის პორნოს ეძებენ სხვადასხვა ეროვნების, სქესის და ასაკის ადამიანები. და რატომღაც ეს არავის აწუხებს. მიუხედავად იმისა, რომ ყველა ეს ამბავი მსგავსია: თითოეულ მათგანში საქმე გვაქვს დიდ მონაცემებთან, რომელსაც XNUMX საუკუნეში "ახალ ზეთს" უწოდებენ.

რა არის დიდი მონაცემები

დიდი მონაცემები - ისინი ასევე დიდი მონაცემებია (ინგლ. დიდი მონაცემები) ან მეტამონაცემები - არის მონაცემთა მასივი, რომელიც მოდის რეგულარულად და დიდი მოცულობით. ისინი გროვდება, მუშავდება და ანალიზდება, რის შედეგადაც მიიღება მკაფიო მოდელები და ნიმუშები.

თვალსაჩინო მაგალითია დიდი ადრონული კოლაიდერის მონაცემები, რომელიც მუდმივად და დიდი რაოდენობით მოდის. მათი დახმარებით მეცნიერები ბევრ პრობლემას წყვეტენ.

მაგრამ დიდი მონაცემები ინტერნეტში არ არის მხოლოდ სტატისტიკა სამეცნიერო კვლევისთვის. მათი გამოყენება შესაძლებელია თვალყური ადევნოთ, თუ როგორ იქცევიან სხვადასხვა ჯგუფისა და ეროვნების მომხმარებლები, რას აქცევენ ყურადღებას და როგორ ურთიერთობენ კონტენტთან. ზოგჯერ, ამისათვის, მონაცემები გროვდება არა ერთი წყაროდან, არამედ რამდენიმედან, ადარებენ და იდენტიფიცირებენ გარკვეულ ნიმუშებს.

იმის შესახებ, თუ რამდენად მნიშვნელოვანია დიდი მონაცემები ქსელში, მათ დაიწყეს საუბარი, როდესაც ეს მართლაც ბევრი იყო. 2020 წლის დასაწყისში მსოფლიოში 4,5 მილიარდი ინტერნეტ მომხმარებელი იყო, აქედან 3,8 მილიარდი რეგისტრირებული იყო სოციალურ ქსელებში.

ვისაც აქვს წვდომა დიდ მონაცემებზე

გამოკითხვების მიხედვით, ჩვენი ქვეყნების ნახევარზე მეტს მიაჩნია, რომ მათ ქსელში არსებული მონაცემები გამოიყენება მესამე მხარის მიერ. ამავდროულად, ბევრი აქვეყნებს პერსონალურ ინფორმაციას, ფოტოებს და ტელეფონის ნომერსაც კი სოციალურ ქსელებსა და აპლიკაციებში.

აქ საჭიროა ახსნა: პირველი ადამიანი თავად მომხმარებელია, რომელიც ათავსებს თავის მონაცემებს ნებისმიერ რესურსზე ან აპლიკაციაზე. ამავდროულად, ის თანახმაა (შეთანხმებაში ნიშანს აყენებს) ამ მონაცემების დამუშავებას მეორე მხარე – ეს არის რესურსის მფლობელები. მესამე მხარე არის ის, ვისაც რესურსის მფლობელებს შეუძლიათ მომხმარებლის მონაცემების გადაცემა ან გაყიდვა. ხშირად ეს წერია მომხმარებლის ხელშეკრულებაში, მაგრამ არა ყოველთვის.

მესამე მხარე არის სამთავრობო უწყებები, ჰაკერები ან კომპანიები, რომლებიც ყიდულობენ მონაცემებს კომერციული მიზნებისთვის. პირველს შეუძლია მიიღოს მონაცემები სასამართლოს ან ზემდგომი ორგანოს გადაწყვეტილებით. ჰაკერები, რა თქმა უნდა, არ იყენებენ არანაირ ნებართვას – ისინი უბრალოდ ჰაკერებენ სერვერებზე შენახულ მონაცემთა ბაზებს. კომპანიებს (კანონმდებლობით) მხოლოდ იმ შემთხვევაში შეუძლიათ წვდომა მონაცემებზე, თუ თქვენ თავად დაუშვით - ხელშეკრულების ველის მონიშვნით. წინააღმდეგ შემთხვევაში, ეს უკანონოა.

რატომ იყენებენ კომპანიები დიდ მონაცემებს?

დიდი მონაცემები კომერციულ სფეროში გამოიყენება ათწლეულების განმავლობაში, უბრალოდ არ იყო ისეთი ინტენსიური, როგორც ახლა. ეს არის, მაგალითად, ჩანაწერები სათვალთვალო კამერებიდან, მონაცემები GPS ნავიგატორებიდან ან ონლაინ გადახდებიდან. ახლა, სოციალური ქსელების, ონლაინ სერვისებისა და აპლიკაციების განვითარებით, ეს ყველაფერი შეიძლება იყოს დაკავშირებული და მიიღოთ ყველაზე სრულყოფილი სურათი: სად ცხოვრობენ პოტენციური მომხმარებლები, რისი ყურება მოსწონთ, სად მიდიან დასასვენებლად და რა მარკის მანქანა აქვთ.

ზემოთ მოყვანილი მაგალითებიდან ირკვევა, რომ დიდი მონაცემების დახმარებით კომპანიებს, პირველ რიგში, სურთ რეკლამის დამიზნება. ანუ პროდუქტების, სერვისების ან ინდივიდუალური ვარიანტების შეთავაზება მხოლოდ სწორ აუდიტორიას და პროდუქტის მორგებაც კი კონკრეტული მომხმარებლისთვის. გარდა ამისა, ფეისბუქზე და სხვა დიდ პლატფორმებზე რეკლამა სულ უფრო და უფრო ძვირდება და მისი ზედიზედ ყველასთვის ჩვენება სულაც არ არის მომგებიანი.

ღია წყაროებიდან პოტენციური მომხმარებლების შესახებ ინფორმაციას აქტიურად იყენებენ სადაზღვევო კომპანიები, კერძო კლინიკები და დამსაქმებლები. პირველს, მაგალითად, შეუძლია შეცვალოს დაზღვევის პირობები, თუ დაინახავს, რომ ხშირად ეძებთ ინფორმაციას გარკვეული დაავადებების ან მედიკამენტების შესახებ, და დამსაქმებლებს შეუძლიათ შეაფასონ, ხართ თუ არა მიდრეკილი კონფლიქტებისა და ანტისოციალური ქცევისკენ.

მაგრამ არის კიდევ ერთი მნიშვნელოვანი ამოცანა, რომელიც ბოლო წლებში იბრძოდა: მიუახლოვდეთ ყველაზე გამხსნელ აუდიტორიას. ამის გაკეთება არც ისე ადვილია, თუმცა ამოცანას მნიშვნელოვნად უწყობს ხელს გადახდის სერვისები და ელექტრონული შემოწმებები ერთი OFD-ის (ფისკალური მონაცემთა ოპერატორის) მეშვეობით. იმისათვის, რომ რაც შეიძლება ახლოს მიუახლოვდნენ, კომპანიები ბავშვობიდანვე ცდილობენ თვალყური ადევნონ და „აღზარდონ“ პოტენციურ კლიენტებს.: ონლაინ თამაშების, ინტერაქტიული სათამაშოებისა და საგანმანათლებლო სერვისების მეშვეობით.

როგორ მუშაობს?

მონაცემთა შეგროვების ყველაზე დიდი შესაძლებლობები არის გლობალური კორპორაციები, რომლებიც ფლობენ რამდენიმე სერვისს ერთდროულად. Facebook-ს ახლა 2,5 მილიარდზე მეტი აქტიური მომხმარებელი ჰყავს. ამავდროულად, კომპანია ფლობს სხვა სერვისებსაც: Instagram – 1 მილიარდზე მეტი, WhatsApp – 2 მილიარდზე მეტი და სხვა.

მაგრამ Google-ს კიდევ უფრო მეტი გავლენა აქვს: Gmail-ს მსოფლიოში 1,5 მილიარდი ადამიანი იყენებს, სხვა 2,5 მილიარდს Android მობილური ოპერაციული სისტემა, 2 მილიარდზე მეტი YouTube-ის მიერ. და ეს არ ითვალისწინებს Google ძიების და Google Maps აპებს, Google Play მაღაზიას და Chrome ბრაუზერს. რჩება თქვენი ონლაინ ბანკის დამაგრება - და Google შეძლებს იცოდეს ფაქტიურად ყველაფერი თქვენს შესახებ. სხვათა შორის, Yandex ამ მხრივ უკვე ერთი ნაბიჯია, მაგრამ ის მხოლოდ რუსულენოვან აუდიტორიას მოიცავს.

???? პირველ რიგში, კომპანიებს აინტერესებთ რას ვაქვეყნებთ და მოგვწონს სოციალურ ქსელებში. მაგალითად, თუ ბანკი ხედავს, რომ გათხოვილი ხართ და აქტიურად მოსწონთ გოგოები ინსტაგრამზე ან ტინდერზე, დიდი ალბათობით დაგიმტკიცებთ სამომხმარებლო სესხს. და იპოთეკა ოჯახზე გაქრა.

ასევე მნიშვნელოვანია, რომელ რეკლამებზე დააწკაპუნებთ, რამდენად ხშირად და რა შედეგით.

(ე.ი. შემდეგი ნაბიჯი არის პირადი შეტყობინებები: ისინი შეიცავს ბევრად მეტ ინფორმაციას. შეტყობინებები გაჟონა VKontakte-ზე, Facebook-ზე, WhatsApp-ზე და სხვა მყისიერ მესინჯერებზე. მათი თქმით, სხვათა შორის, გეოლოკაციაზე თვალყურის დევნება მარტივია შეტყობინების გაგზავნის დროს. რა თქმა უნდა შეგიმჩნევიათ: როცა ვინმესთან რაიმეს ყიდვაზე ან უბრალოდ პიცის შეკვეთაზე განიხილავთ, შესაბამისი რეკლამა მაშინვე ჩნდება არხში.

🚕 დიდი მონაცემები აქტიურად გამოიყენება და „გაჟონავს“ მიწოდებისა და ტაქსის სერვისების მიერ. მათ იციან, სად ცხოვრობ და მუშაობ, რა გიყვარს, როგორია შენი სავარაუდო შემოსავალი. მაგალითად, Uber აჩვენებს უფრო მაღალ ფასს, თუ ბარიდან სახლში მიდიხართ და აშკარად გადაჭარბებული ხართ. და როცა ტელეფონზე გყავს სხვა აგრეგატორების თაიგული, პირიქით, უფრო იაფს შემოგთავაზებენ.

(ე.ი. არის სერვისები, რომლებიც იყენებენ ფოტოებსა და ვიდეოებს რაც შეიძლება მეტი ინფორმაციის მოსაგროვებლად. მაგალითად, კომპიუტერული ხედვის ბიბლიოთეკები - Google-ს აქვს ერთი. ისინი სკანირებენ შენ და შენს გარემოცვას, რათა ნახონ, რა ზომის ან სიმაღლის ხარ, რა ბრენდს ატარებ, რა მანქანას ატარებ, გყავს თუ არა ბავშვები თუ შინაური ცხოველები.

(ე.ი. მათ, ვინც აწვდის ბანკებს SMS კარიბჭეებს მათი გაგზავნისთვის, შეუძლიათ თვალყური ადევნონ თქვენს შესყიდვებს ბარათზე – იცოდეთ ბოლო 4 ციფრი და ტელეფონის ნომერი – და შემდეგ მიყიდეთ ეს მონაცემები სხვას. აქედან გამომდინარე, მთელი ეს სპამი ფასდაკლებით და პიცა საჩუქრად.

🤷️️ და ბოლოს, ჩვენ თვითონ ვავრცელებთ ჩვენს მონაცემებს მარცხენა სერვისებსა და აპლიკაციებში. დაიმახსოვრე ის აჟიოტაჟი Getcontact-ის გარშემო, როდესაც ყველას სიამოვნებით ავსებდა ტელეფონის ნომრის გაცნობას, თუ როგორ ეწერა ის სხვებმა. ახლა კი იპოვეთ მათი შეთანხმება და წაიკითხეთ რას ამბობს თქვენი მონაცემების გადაცემაზე (სპოილერი: მფლობელებს შეუძლიათ მათი შეხედულებისამებრ გადასცენ მესამე პირებს):

კორპორაციებს შეუძლიათ წარმატებით შეაგროვონ და გაყიდონ მომხმარებლის მონაცემები წლების განმავლობაში, სანამ საქმე სასამართლოს არ მივა - როგორც ეს იგივე Facebook-თან მოხდა. შემდეგ კი გადამწყვეტი როლი ითამაშა კომპანიის მიერ GDPR-ის დარღვევამ - კანონი ევროკავშირში, რომელიც ზღუდავს მონაცემთა გამოყენებას ბევრად უფრო მკაცრად, ვიდრე ამერიკული. კიდევ ერთი ბოლო მაგალითია Avast ანტივირუსული სკანდალი: კომპანიის ერთ-ერთმა შვილობილი სერვისმა შეაგროვა და გაყიდა მონაცემები 100-დან 400 მილიონამდე მომხმარებლისგან.

მაგრამ აქვს თუ არა ამ ყველაფერს რაიმე უპირატესობა ჩვენთვის?

რამდენად გვეხმარება დიდი მონაცემები თითოეულ ჩვენგანს?

დიახ, არსებობს ნათელი მხარეც.

დიდი მონაცემები ეხმარება კრიმინალების დაჭერას და ტერორისტული თავდასხმების თავიდან აცილებას, დაკარგული ბავშვების პოვნას და მათ დაცვას საფრთხისგან.

მათი დახმარებით ჩვენ ჩვენ ვიღებთ მაგარ შეთავაზებებს ბანკებისგან და პერსონალურ ფასდაკლებებს. მათი წყალობით ჩვენ ჩვენ არ ვიხდით ბევრ სერვისსა და სოციალურ ქსელში, რომლებიც შემოსავალს მხოლოდ რეკლამით იღებენ. წინააღმდეგ შემთხვევაში, მარტო ინსტაგრამი თვეში რამდენიმე ათასი დოლარი დაგვიჯდებოდა.

მხოლოდ Facebook-ს ჰყავს 2,4 მილიარდი აქტიური მომხმარებელი. ამასთან, მათმა მოგებამ 2019 წელს 18,5 მილიარდი დოლარი შეადგინა. გამოდის, რომ კომპანია რეკლამის საშუალებით ყოველწლიურად 7,7 დოლარამდე შემოსავალს იღებს.

დაბოლოს, ზოგჯერ ეს უბრალოდ მოსახერხებელია: როცა სერვისებმა უკვე იციან სად ხართ და რა გსურთ და თქვენ არ გჭირდებათ თავად მოძებნოთ საჭირო ინფორმაცია.

დიდი მონაცემების გამოყენების კიდევ ერთი პერსპექტიული სფეროა განათლება.

ვირჯინიის ერთ-ერთ ამერიკულ უნივერსიტეტში ჩატარდა კვლევა ე.წ. რისკის ჯგუფის სტუდენტების მონაცემების შეგროვების მიზნით. ესენი არიან ისინი, ვინც ცუდად სწავლობენ, აცდენენ გაკვეთილებს და აპირებენ სწავლის მიტოვებას. ფაქტია, რომ შტატებში ყოველწლიურად დაახლოებით 400 ადამიანი აკლდება. ეს ცუდია როგორც უნივერსიტეტებისთვის, რომლებსაც აქვთ რეიტინგი და მცირდება დაფინანსება, ასევე თავად სტუდენტებისთვისაც: ბევრი იღებს სესხს განათლებისთვის, რომელიც დაქვითვის შემდეგ მაინც უნდა დაფაროს. რომ აღარაფერი ვთქვათ დაკარგული დროისა და კარიერული პერსპექტივების შესახებ. დიდი მონაცემების საშუალებით შესაძლებელია დროში ჩამორჩენის იდენტიფიცირება და მათთვის დამრიგებლის შეთავაზება, დამატებითი გაკვეთილები და სხვა მიზნობრივი დახმარება.

ეს, სხვათა შორის, სკოლებსაც შეეფერება: შემდეგ სისტემა მასწავლებლებს და მშობლებს შეატყობინებს – ამბობენ, ბავშვს პრობლემები აქვს, ერთად დავეხმაროთო. დიდი მონაცემები ასევე დაგეხმარებათ გაიგოთ, რომელი სახელმძღვანელოები მუშაობს უკეთესად და რომელი მასწავლებლები ხსნიან მასალას უფრო მარტივად.

კიდევ ერთი დადებითი მაგალითია კარიერის პროფილირება.: სწორედ მაშინ ეხმარებიან მოზარდებს მომავალი პროფესიის გადაწყვეტაში. აქ დიდი მონაცემები საშუალებას გაძლევთ შეაგროვოთ ინფორმაცია, რომლის მიღებაც შეუძლებელია ტრადიციული ტესტების გამოყენებით: როგორ იქცევა მომხმარებელი, რას აქცევს ყურადღებას, როგორ ურთიერთქმედებს შინაარსთან.

ამავე აშშ-ში მოქმედებს კარიერული ხელმძღვანელობის პროგრამა – SC ACCELERATE. ის, სხვა საკითხებთან ერთად, იყენებს CareerChoice GPS ტექნოლოგიას: ისინი აანალიზებენ მონაცემებს სტუდენტების ბუნების, საგნებისადმი მათი მიდრეკილებების, ძლიერი და სუსტი მხარეების შესახებ. შემდეგ მონაცემები გამოიყენება მოზარდების დასახმარებლად, აირჩიონ მათთვის შესაფერისი კოლეჯები.

გამოიწერეთ და მოგვყევით Yandex.Zen-ზე — ტექნოლოგია, ინოვაცია, ეკონომიკა, განათლება და გაზიარება ერთ არხზე.

დატოვე პასუხი