0% found this document useful (0 votes)

14 views3 pages

Syllabus

The document outlines a course on Mining Massive Datasets, focusing on data mining concepts, algorithms, and applications. It covers topics such as recommendation systems, social networks, data stream mining, and contextual-bandit approaches. The course aims to equip students with the skills to analyze and model real-world data mining problems effectively.

Uploaded by

aburoobhastudy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views3 pages

Syllabus

Uploaded by

aburoobhastudy

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

20AIEL708 MINING MASSIVE DATASETS L T P C

3 0 0 3

Course Objectives:

To understand the basic concepts, principles, and techniques in data mining

To learn the classical data mining algorithms
To perform systematic analyze the real world data mining problems
To model data mining problems and evaluate, visualize and communicate
statistical models

UNIT I INTRODUCTION 9

Data Mining – Modeling, Statistical limits on Data Mining, Importance of Words in

Documents, Hash Functions, indexe.s Map Reduce and the New Software Stack –
Distributed File systems, Map Reduce, Algorithms using Map Reduce, Extensions to
Map Reduce, The Communication Cost Model, Complexity „theory For Map Reduce.

UNIT II RECOMMENDATION SYSTEM 9

Finding Similar Items – Applications of Set similarity, Shingling of Documents,

Similarities Preserving Summaries of Sets, Locality Sensitive Hashing for Documents,
Distance Measures, theory of locality-sensitive functions, LSH families for Other
Distance Measures, Applications of LSH, Methods for High Degrees of Similarity.

UNIT III SOCIAL NETWORKS 9

Mining Data Streams – The Stream Data Model, Sampling Data in a stream, Filtering
Streams, Counting Distinct Elements in a Stream, Estimating Moments, Counting Ones
in a Window, Decaying Windows. Link Analysis -Page Rank, Efficient Computation of
Page Rank, Topic Sensitive Page Rank, Link Spam, Hubs and Authorities

UNIT IV MINING DATA STREAMS 9

Frequent Itemsets- Market- Basket Model, A-Priori Algorithm, Handling Larger Datasets
in Main Memory, Limited –Pass Algorithm , Counting Frequent Items in a Stream,
Clustering – Introduction, Hierarchical Clustering, K-Means Clustering, CURE
Algorithm, Clustering in Non- Euclidean Spaces, Clustering for Streams and Parallelism
Advertising on the Web- Issues in online Algorithms, The matching Problem, The
Adwords Problem, Adwords implementation

UNIT V CONTEXTUAL-BANDIT APPROACH 9

Recommendation System Content-Based Recommendations-Item Profiles,Discovering

Features of Documents, Obtaining Item Features From Tags,Representing Item
Profiles,User Profiles,Recommending Items to Users Based on Content, Classification
Algorithms, A Contextual-Bandit Approach to Personalized News Article
Recommendation.

TEXTBOOK

1. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman, “Mining of Massive

Datasets“, 2019.

COURSE OUTCOMES :

1. Understand the fundamental concepts and statistical limits of data mining and
MapReduce programming model (K2)
2. Understand similarity detection techniques to identify similar items in large
datasets.(K2)
3. Apply appropriate algorithms to perform link analysis and data stream mining in
large-scale networks.(K3)
4. Analyze clustering methods and frequent itemset mining techniques for handling
large-scale and streaming datasets.(K4)
5. Understand content-based recommendation systems and contextual-bandit
approaches for personalization.(K2)
6. Analyze the efficiency, scalability, and computational cost of different applications
and platforms.(K4)

CO-PO, PSO MAPPING :

PO1 PO2 PO3 PO4 PO5 PO6 PO7 PO8 PO9 PO1 PO11 PO12 PSO1 PSO
0 2

CO1 3 - 3 1 - - - - 2 1 3 - 3 2

CO2 3 - 2 3 - - 1 - - - 2 - 2 1

CO3 3 - 3 3 - - - - - - 3 - 3 1

CO4 3 - 3 3 - - - - - - 3 - 2 2
CO5 3 - 3 3 - - - - - - 3 - 3 2
CO6 3 - 3 3 - - - - - - 3 - 3 2

BDA - CSE Syllabus
No ratings yet
BDA - CSE Syllabus
2 pages
BigData Mining and Analytics
No ratings yet
BigData Mining and Analytics
2 pages
Ad23701 Mining of Massive Data Sets
No ratings yet
Ad23701 Mining of Massive Data Sets
2 pages
Mmds Syllabus
No ratings yet
Mmds Syllabus
2 pages
Cse2021 - Data Mining CH
No ratings yet
Cse2021 - Data Mining CH
13 pages
DWDM
No ratings yet
DWDM
3 pages
MR20 Vi-I Syllabus
No ratings yet
MR20 Vi-I Syllabus
22 pages
2024-25 CSE V Sem B Section DWDM Course Handout
No ratings yet
2024-25 CSE V Sem B Section DWDM Course Handout
6 pages
Handout
No ratings yet
Handout
4 pages
19cs521-Data Warehousing and Data Mining
No ratings yet
19cs521-Data Warehousing and Data Mining
3 pages
Da Notes - 2019
No ratings yet
Da Notes - 2019
201 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
3 pages
Syllabus Sem 7
No ratings yet
Syllabus Sem 7
10 pages
MCA420 - Data and Web Mining
No ratings yet
MCA420 - Data and Web Mining
3 pages
CSE704 Data Analytics Syllabus Theory
No ratings yet
CSE704 Data Analytics Syllabus Theory
2 pages
20CS4702A
No ratings yet
20CS4702A
2 pages
Course Plan - Data Mining
No ratings yet
Course Plan - Data Mining
3 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
CS8091 Big Data Analytics
No ratings yet
CS8091 Big Data Analytics
28 pages
DMDW Lesson Plan
No ratings yet
DMDW Lesson Plan
8 pages
Data Warehousing & Mining Course
No ratings yet
Data Warehousing & Mining Course
45 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
De Theory
No ratings yet
De Theory
2 pages
Data Mining and Visualization
No ratings yet
Data Mining and Visualization
18 pages
DM Handbook
No ratings yet
DM Handbook
11 pages
A4629ac494 Syllabus
No ratings yet
A4629ac494 Syllabus
3 pages
Data Science Syllabus
No ratings yet
Data Science Syllabus
3 pages
Syllabus
No ratings yet
Syllabus
4 pages
Sen 935
No ratings yet
Sen 935
4 pages
Data Warehousing and Data Mining
No ratings yet
Data Warehousing and Data Mining
4 pages
Data Mining
No ratings yet
Data Mining
2 pages
Course Objectives DM
No ratings yet
Course Objectives DM
4 pages
CS8091 Bigdata Analytics Lessonplan With Date
No ratings yet
CS8091 Bigdata Analytics Lessonplan With Date
11 pages
IT-416 Data Mining
No ratings yet
IT-416 Data Mining
3 pages
Data Mining Handout
No ratings yet
Data Mining Handout
4 pages
Da Handbook
No ratings yet
Da Handbook
18 pages
Semester 2
No ratings yet
Semester 2
14 pages
Summer Term 2024 Course Handout: Date: 28.05.2024
No ratings yet
Summer Term 2024 Course Handout: Date: 28.05.2024
3 pages
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
No ratings yet
Lesson Plan: Unit Topic Books For Reference No. of Hours Required Teaching Methodology
6 pages
BIT 454 - Data Warehousing and Data Mining
No ratings yet
BIT 454 - Data Warehousing and Data Mining
2 pages
Machine Learning Course Overview
No ratings yet
Machine Learning Course Overview
7 pages
Big Data Syllabus
No ratings yet
Big Data Syllabus
1 page
Introduction To Data Science 439
No ratings yet
Introduction To Data Science 439
28 pages
ch01 Intro
No ratings yet
ch01 Intro
45 pages
Guidelines Data mining-II BA Major Sem 4 NEP
No ratings yet
Guidelines Data mining-II BA Major Sem 4 NEP
2 pages
DMDW Day-Wise Lesson Plan
No ratings yet
DMDW Day-Wise Lesson Plan
4 pages
Data Mining and Knowledge Discovery Course Content
No ratings yet
Data Mining and Knowledge Discovery Course Content
2 pages
Data Analytics Syllabus Created
No ratings yet
Data Analytics Syllabus Created
3 pages
Data Analytics Analysis
No ratings yet
Data Analytics Analysis
8 pages
391 - CS8091 Big Data Analytics - Anna University 2017 Regulation Syllabus
0% (2)
391 - CS8091 Big Data Analytics - Anna University 2017 Regulation Syllabus
2 pages
BDI Summary-4
No ratings yet
BDI Summary-4
61 pages
DWDM CP - Iii - A
No ratings yet
DWDM CP - Iii - A
8 pages
CP9164 Data Warehousing and Data Mining LTPC 3 0 0 3 Unit I 9
No ratings yet
CP9164 Data Warehousing and Data Mining LTPC 3 0 0 3 Unit I 9
2 pages
Data Analytics Sys
No ratings yet
Data Analytics Sys
1 page
DM-Course File
No ratings yet
DM-Course File
14 pages
I Need Every Trick and Formula On The Time and Wor
No ratings yet
I Need Every Trick and Formula On The Time and Wor
3 pages
Intern Report
No ratings yet
Intern Report
10 pages
Deep Learning For Medicinal Plant
No ratings yet
Deep Learning For Medicinal Plant
6 pages
Gemini
No ratings yet
Gemini
23 pages
Poorna Siri-412520243019
No ratings yet
Poorna Siri-412520243019
43 pages
Unit I 20HSMG601 - Principles of Engineeering Management
No ratings yet
Unit I 20HSMG601 - Principles of Engineeering Management
34 pages
Unit II 20HSMG601 - Principles of Engineeering Management
No ratings yet
Unit II 20HSMG601 - Principles of Engineeering Management
13 pages
BDA Question BANK
No ratings yet
BDA Question BANK
7 pages
Bda Unit 4
No ratings yet
Bda Unit 4
16 pages
20aipw602-Big Data Analytics With Lab
No ratings yet
20aipw602-Big Data Analytics With Lab
14 pages
Unit III-IOT - LESSON
No ratings yet
Unit III-IOT - LESSON
12 pages
Self Refferential Structure
No ratings yet
Self Refferential Structure
30 pages
ALP TRG 112 Housing Plate Auto Z Machining 2020.1
No ratings yet
ALP TRG 112 Housing Plate Auto Z Machining 2020.1
120 pages
Mimosa by Airspan C6x Datasheet DS A0025 03
No ratings yet
Mimosa by Airspan C6x Datasheet DS A0025 03
5 pages
Doosan Robotics User Manual V2.7 v2.3 EN
No ratings yet
Doosan Robotics User Manual V2.7 v2.3 EN
240 pages
Intro to Object-Oriented Programming
No ratings yet
Intro to Object-Oriented Programming
61 pages
Curriculum Vitae: Rajat Agrawal
No ratings yet
Curriculum Vitae: Rajat Agrawal
3 pages
IT Capstone: Vet Management System
No ratings yet
IT Capstone: Vet Management System
10 pages
College Student Management System
No ratings yet
College Student Management System
3 pages
Unit 5
No ratings yet
Unit 5
74 pages
Icertify Training - The Ultimate AWS® Certified Cloud Practitioner Training Manual - The Complete Guide To Get You AWS Cloud Practitioner Certified On Your First Attempt (2021)
100% (2)
Icertify Training - The Ultimate AWS® Certified Cloud Practitioner Training Manual - The Complete Guide To Get You AWS Cloud Practitioner Certified On Your First Attempt (2021)
703 pages
2024 Malware Obfuscation and Evasion
No ratings yet
2024 Malware Obfuscation and Evasion
154 pages
MRTG Traffic Sum
No ratings yet
MRTG Traffic Sum
2 pages
GCV440 Wifi Manual 2022
No ratings yet
GCV440 Wifi Manual 2022
18 pages
Computer Knowledge: Upsc Epfo
No ratings yet
Computer Knowledge: Upsc Epfo
10 pages
Evolution of Media: Traditional to New
No ratings yet
Evolution of Media: Traditional to New
27 pages
Forensic 1 Chapter 4
No ratings yet
Forensic 1 Chapter 4
12 pages
ESurvey Quick Command Reference Guide
100% (1)
ESurvey Quick Command Reference Guide
53 pages
Topic 1 - User Documentation
No ratings yet
Topic 1 - User Documentation
12 pages
Rip Ospf BGP
No ratings yet
Rip Ospf BGP
2 pages
Embedded & Microcontroller Application
No ratings yet
Embedded & Microcontroller Application
8 pages
Scan
No ratings yet
Scan
72 pages
PT. Cyberindo Aditama (CBN) - Company Profile
100% (2)
PT. Cyberindo Aditama (CBN) - Company Profile
15 pages
BA - Company Profile (2023)
No ratings yet
BA - Company Profile (2023)
27 pages
MPEG-4 AVC H.264 Video Codec Comparison
No ratings yet
MPEG-4 AVC H.264 Video Codec Comparison
87 pages
R09 Technical Highlights
No ratings yet
R09 Technical Highlights
9 pages
Meitrack Sms Protocol
No ratings yet
Meitrack Sms Protocol
37 pages
Omnistar Productsheet en
No ratings yet
Omnistar Productsheet en
30 pages
Alarmserver Userguide Uk
No ratings yet
Alarmserver Userguide Uk
14 pages
Get Front End Web Development The Big Nerd Ranch Guide Free All Chapters
100% (6)
Get Front End Web Development The Big Nerd Ranch Guide Free All Chapters
13 pages
Bakasan Komai Game Da Crypto Ba (Hausa) by Misbahu Bichi
100% (1)
Bakasan Komai Game Da Crypto Ba (Hausa) by Misbahu Bichi
29 pages

Syllabus

Uploaded by

Syllabus

Uploaded by

20AIEL708 MINING MASSIVE DATASETS L T P C​

​ To understand the basic concepts, principles, and techniques in data mining

Data Mining – Modeling, Statistical limits on Data Mining, Importance of Words in

UNIT II RECOMMENDATION SYSTEM​ ​ ​ ​ ​ 9

Finding Similar Items – Applications of Set similarity, Shingling of Documents,

UNIT III SOCIAL NETWORKS​ ​ ​ ​ ​ ​ 9

UNIT IV MINING DATA STREAMS​ ​ ​ ​ ​ ​ 9

UNIT V CONTEXTUAL-BANDIT APPROACH​ ​ ​ ​ 9

Recommendation System Content-Based Recommendations-Item Profiles,Discovering

1.​ Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman, “Mining of Massive

CO-PO, PSO MAPPING :

You might also like

20AIEL708 MINING MASSIVE DATASETS L T P C

To understand the basic concepts, principles, and techniques in data mining

UNIT II RECOMMENDATION SYSTEM 9

UNIT III SOCIAL NETWORKS 9

UNIT IV MINING DATA STREAMS 9

UNIT V CONTEXTUAL-BANDIT APPROACH 9

1. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman, “Mining of Massive