Introduction To Data Mining Assignment 2

This document is an assignment on data mining that includes questions about frequent itemset mining using Apriori and FP-growth algorithms, as well as implementation tasks for these algorithms in programming languages like C++ or Java. It also explores association rules, correlation relationships, and various measures of confidence in the context of supermarket transaction data. The assignment requires analysis of algorithm performance and correlation relationships based on given data sets.

Uploaded by

Ayesha Rahim

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

84 views1 page

Introduction To Data Mining Assignment 2

Uploaded by

Ayesha Rahim

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Introduction to Data Mining

Assignment #2

Q#1: A database has five transactions. Let min-sup=60% and min-conf=80%

TID Items-bought
T100 {M, O, N, K, E, Y}
T200 {D, O, N, K, E, Y}
T300 {M, A, K, E}
T400 {M, U, C, K, Y}
T500 {C, O, O, K, I, E}
Find all frequent itemsets using Apriori and FP-growth, respectively. Compare the efficiency of
the two mining processes.
List all the strong association rules (with support s and confidence c) matching the following
metarule, where X is a variable representing customers, and item I denotes variables representing
items(e.g, “A,” “B”);)
∀x ∈ transaction, buys(X,item1) ∧ buys(X,item2) ⇒ buys(X,item3) [s,c]
Q#2: (Implementation project) Using a programming language that you are familiar with, such
as C++ or Java, implement three frequent itemset mining algorithms introduced in this chapter:
(1) Apriori [AS94b], (2) FP-growth [HPY00], and (3) Eclat [Zak00] (mining using the
vertical data format). Compare the performance of each algorithm with various kinds of large
data sets. Write a report to analyze the situations (e.g., data size, data distribution, minimal
support threshold setting, and pattern density) where one algorithm may perform better than the
others, and state why?
Q#3: Give a short example to show that items in a strong association rule actually may be
negatively correlated.
Q#4: The following contingency table summarizes supermarket transaction data, where hot dogs
refers to the transactions containing hot dogs, hot dogs refers to the transactions that do not
contain hot dogs, hamburgers refers to the transactions containing hamburgers, and hamburgers
refers to the transactions that do not contain hamburgers.

(a) Suppose that the association rule “hot dogs ⇒ hamburgers” is mined. Given a minimum
support threshold of 25% and a minimum confidence threshold of 50%, is this association rule
strong?
(b) Based on the given data, is the purchase of hot dogs independent of the purchase of
hamburgers? If not, what kind of correlation relationship exists between the two?
(c) Compare the use of the all confidence, max confidence, Kulczynski, and cosine measures
with lift and correlation on the given data.

DMKD Module4 Part-B
No ratings yet
DMKD Module4 Part-B
17 pages
Unit 2 Question and Answers Bdhdns
No ratings yet
Unit 2 Question and Answers Bdhdns
15 pages
Assignment 03
No ratings yet
Assignment 03
9 pages
Suppose A Student Collected The Price and Weight of 20 Products in A Shop With The Following Result
No ratings yet
Suppose A Student Collected The Price and Weight of 20 Products in A Shop With The Following Result
4 pages
Seperated
No ratings yet
Seperated
11 pages
I. Review Questions Chapter 4: Mining Frequent Patterns, Associations, Ad Corelations
No ratings yet
I. Review Questions Chapter 4: Mining Frequent Patterns, Associations, Ad Corelations
19 pages
Data Mining Exam Solutions
No ratings yet
Data Mining Exam Solutions
5 pages
DMDW Unit 4 Association 29.12.2020
No ratings yet
DMDW Unit 4 Association 29.12.2020
31 pages
BTech Data Mining Exam Prep
No ratings yet
BTech Data Mining Exam Prep
8 pages
Unsupervised Learning Essentials
No ratings yet
Unsupervised Learning Essentials
64 pages
Thabet Slimani - Efficiant Analysis of Pattern and Association Rule Mining Approaches
No ratings yet
Thabet Slimani - Efficiant Analysis of Pattern and Association Rule Mining Approaches
14 pages
Data Mining Assignment Guide
No ratings yet
Data Mining Assignment Guide
2 pages
Data Mining Unit 2 1
No ratings yet
Data Mining Unit 2 1
15 pages
Mining Frequent Patterns, Association and Correlations - Basic Concepts and Methods
No ratings yet
Mining Frequent Patterns, Association and Correlations - Basic Concepts and Methods
55 pages
Data Cube Computation and Data Generation
No ratings yet
Data Cube Computation and Data Generation
54 pages
M.Tech Exam: Data Warehousing & Mining
No ratings yet
M.Tech Exam: Data Warehousing & Mining
5 pages
DMDW Qa-3.2
No ratings yet
DMDW Qa-3.2
11 pages
Data Mining Assignment Guide
No ratings yet
Data Mining Assignment Guide
13 pages
Mining Frequent Itemset-Association Analysis
No ratings yet
Mining Frequent Itemset-Association Analysis
59 pages
DW & DM Questions & Answers
No ratings yet
DW & DM Questions & Answers
12 pages
Unit II
No ratings yet
Unit II
22 pages
Data Mining Exam Paper Summer 2023
No ratings yet
Data Mining Exam Paper Summer 2023
3 pages
p139 Data Mining Mafia
No ratings yet
p139 Data Mining Mafia
13 pages
Unit 2-2
No ratings yet
Unit 2-2
53 pages
Data Mining: Frequent Itemsets & Clustering
No ratings yet
Data Mining: Frequent Itemsets & Clustering
152 pages
Association Rule-A Tool For Data Mining: Praveen Ranjan Srivastava
No ratings yet
Association Rule-A Tool For Data Mining: Praveen Ranjan Srivastava
6 pages
DMDW - Association Analysis
No ratings yet
DMDW - Association Analysis
12 pages
Association Rule Mining
No ratings yet
Association Rule Mining
10 pages
Comparison of Two Association Rule Mining Algorith PDF
No ratings yet
Comparison of Two Association Rule Mining Algorith PDF
9 pages
Question Bank: Q1) What Is Data Warehouse?
No ratings yet
Question Bank: Q1) What Is Data Warehouse?
17 pages
Data Mining Suggestions
No ratings yet
Data Mining Suggestions
5 pages
Association Rule Mapping - Unit-4
No ratings yet
Association Rule Mapping - Unit-4
11 pages
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
No ratings yet
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
31 pages
Vi Sem Bca Qbank - Wcms - Fds
50% (2)
Vi Sem Bca Qbank - Wcms - Fds
11 pages
Association RuleMining
No ratings yet
Association RuleMining
52 pages
DWDM Unit III Notes
No ratings yet
DWDM Unit III Notes
23 pages
Efficient Algorithm for Closed Itemsets
No ratings yet
Efficient Algorithm for Closed Itemsets
8 pages
DWDM Unit 2 and 3
No ratings yet
DWDM Unit 2 and 3
31 pages
06 FPBasic
No ratings yet
06 FPBasic
69 pages
Inbound 5799672056943946753
No ratings yet
Inbound 5799672056943946753
47 pages
21CSE355T DMA-8-15 Marks Question Bank
No ratings yet
21CSE355T DMA-8-15 Marks Question Bank
2 pages
Association Rule Mining Guide
No ratings yet
Association Rule Mining Guide
16 pages
Unit - 3 Mining Frequent Patterns
No ratings yet
Unit - 3 Mining Frequent Patterns
10 pages
Data Mining UNIT 3 LECTURE NOTES
No ratings yet
Data Mining UNIT 3 LECTURE NOTES
13 pages
Fds - III Unit
No ratings yet
Fds - III Unit
13 pages
Understanding Association Rule in Data Mining
No ratings yet
Understanding Association Rule in Data Mining
4 pages
Data Ming
No ratings yet
Data Ming
28 pages
Data Mining for Business Insights
No ratings yet
Data Mining for Business Insights
7 pages
Efficient Mining Frequent Itemsets Algorithms: Marghny H. Mohamed Mohammed M. Darwieesh
No ratings yet
Efficient Mining Frequent Itemsets Algorithms: Marghny H. Mohamed Mohammed M. Darwieesh
11 pages
Module 2
No ratings yet
Module 2
14 pages
Mining Frequent Patterns and Associations
No ratings yet
Mining Frequent Patterns and Associations
52 pages
DWDM - Unit - IV
No ratings yet
DWDM - Unit - IV
67 pages
Module5 DMW
No ratings yet
Module5 DMW
13 pages
FDS Unit02
No ratings yet
FDS Unit02
16 pages
Practical Projects
100% (32)
Practical Projects
478 pages
Python in Excel (2024)
100% (14)
Python in Excel (2024)
607 pages
Analytics Python Programming
92% (13)
Analytics Python Programming
203 pages
Excel Formulas and Functions
86% (28)
Excel Formulas and Functions
126 pages
Cyber Security Questions and Answers PDF
82% (11)
Cyber Security Questions and Answers PDF
234 pages
TCP/IP
100% (15)
TCP/IP
286 pages
Mastering C++ Programming
100% (6)
Mastering C++ Programming
451 pages
Data Structure and Algorithms With Python
100% (16)
Data Structure and Algorithms With Python
369 pages
50 Most Common Interview Questions and Answers
91% (46)
50 Most Common Interview Questions and Answers
40 pages
Computer Basics
90% (10)
Computer Basics
403 pages
Linux Commands Handbook PDF
100% (16)
Linux Commands Handbook PDF
135 pages
Full Course of Machine Learning
100% (17)
Full Course of Machine Learning
660 pages
Python Programming for Beginners_ From Basics to AI Integrations. 5-Minute Illustrated Tutorials, Coding Hacks, Hands-On Exercises & Case Studies to Master Python in 7 Days and Get Paid More by Prince
100% (15)
Python Programming for Beginners_ From Basics to AI Integrations. 5-Minute Illustrated Tutorials, Coding Hacks, Hands-On Exercises & Case Studies to Master Python in 7 Days and Get Paid More by Prince
244 pages
C# Cheat Sheet
100% (6)
C# Cheat Sheet
1 page
Python Cheat Sheets
97% (33)
Python Cheat Sheets
11 pages
Most Common Interview Questions and Answers
86% (35)
Most Common Interview Questions and Answers
3 pages
The Python Bible
97% (33)
The Python Bible
506 pages
101 Best Microsoft Excel Tips & Tricks Ebook v1.3 - LM
97% (29)
101 Best Microsoft Excel Tips & Tricks Ebook v1.3 - LM
616 pages
Joel Murach, Mary Delamater - Murach's C++ Programming-Mike Murach & Associates (2018) PDF
100% (7)
Joel Murach, Mary Delamater - Murach's C++ Programming-Mike Murach & Associates (2018) PDF
802 pages
Basic Computer Fundamentals Guide
100% (5)
Basic Computer Fundamentals Guide
46 pages
Python Guide for Beginners
100% (8)
Python Guide for Beginners
115 pages
Head First Python PDF
96% (26)
Head First Python PDF
494 pages
(Hunt, J.) A Beginners Guide To Python 3 Programming
96% (47)
(Hunt, J.) A Beginners Guide To Python 3 Programming
440 pages
CCNA 200-301 Practice Exam Questions 2020
100% (8)
CCNA 200-301 Practice Exam Questions 2020
350 pages
500+ Coding Projects With Source Code
70% (10)
500+ Coding Projects With Source Code
12 pages
Learn C Programming
100% (10)
Learn C Programming
169 pages
JavaScript Algorithms
94% (16)
JavaScript Algorithms
292 pages
C Programming Exercises
85% (13)
C Programming Exercises
26 pages
Computer Network
100% (10)
Computer Network
409 pages
Computer Network Notes Class 12
82% (22)
Computer Network Notes Class 12
13 pages
Wa0070.
No ratings yet
Wa0070.
3 pages
CH 2 Complete
No ratings yet
CH 2 Complete
39 pages
Multithreading in OS Concepts
No ratings yet
Multithreading in OS Concepts
14 pages
Web Application Assignment No 3
No ratings yet
Web Application Assignment No 3
4 pages
Computer Graphics: Week 4: Presentation By: Ms. Ifrah Mansoor
No ratings yet
Computer Graphics: Week 4: Presentation By: Ms. Ifrah Mansoor
48 pages
Intro to Computer Graphics Basics
No ratings yet
Intro to Computer Graphics Basics
41 pages
Understanding Graphics APIs & GPUs
No ratings yet
Understanding Graphics APIs & GPUs
55 pages
Inter Process Communication
No ratings yet
Inter Process Communication
25 pages
Scanned With Camscanner
No ratings yet
Scanned With Camscanner
14 pages
1 Familiarisation of Xilinx Ise
No ratings yet
1 Familiarisation of Xilinx Ise
6 pages
F Pace 19my MB Ge V9a Dx-6
No ratings yet
F Pace 19my MB Ge V9a Dx-6
112 pages
Corona Multi Service R410A Manual
No ratings yet
Corona Multi Service R410A Manual
54 pages
Practical Modeling For Nonlinear Seismic Response of RC Wall Structures
100% (1)
Practical Modeling For Nonlinear Seismic Response of RC Wall Structures
10 pages
Mumbai Plan
No ratings yet
Mumbai Plan
230 pages
MRF454 80W 30MHz RF Transistor Data
No ratings yet
MRF454 80W 30MHz RF Transistor Data
5 pages
RRZZHHTT-65A-R6H4 Product Specifications (Comprehensive)
No ratings yet
RRZZHHTT-65A-R6H4 Product Specifications (Comprehensive)
6 pages
A33 Si - Kitchen Ventilation
No ratings yet
A33 Si - Kitchen Ventilation
1 page
Recent Changes in Software Patenting in India
No ratings yet
Recent Changes in Software Patenting in India
4 pages
Language Models
No ratings yet
Language Models
50 pages
List Config
No ratings yet
List Config
9 pages
Growing Pains Joel S. Hirschhorn
No ratings yet
Growing Pains Joel S. Hirschhorn
74 pages
Safety in Chemical Engineering
100% (2)
Safety in Chemical Engineering
16 pages
MATH
No ratings yet
MATH
12 pages
Ema
No ratings yet
Ema
14 pages
FT Online
No ratings yet
FT Online
8 pages
(Undergraduate Lecture Notes in Physics) Mark Gallaway - An Introduction To Observational Astrophysics (2020, Springer)
100% (2)
(Undergraduate Lecture Notes in Physics) Mark Gallaway - An Introduction To Observational Astrophysics (2020, Springer)
242 pages
DR Ranjith
No ratings yet
DR Ranjith
8 pages
Elements of Chemical Reaction Engineering Fourth Edition H. Scott Fogler Latest PDF 2025
0% (1)
Elements of Chemical Reaction Engineering Fourth Edition H. Scott Fogler Latest PDF 2025
165 pages
Chemistry An Atoms First Approach 2nd Edition Steven S Zumdahl Susan A Zumdahl Digital Access
100% (1)
Chemistry An Atoms First Approach 2nd Edition Steven S Zumdahl Susan A Zumdahl Digital Access
405 pages
Capacitance - JEE Main 2024 January-Pages-1
No ratings yet
Capacitance - JEE Main 2024 January-Pages-1
3 pages
Edu 580 Finallessonplan
No ratings yet
Edu 580 Finallessonplan
6 pages
Ohs Consultation 2
No ratings yet
Ohs Consultation 2
11 pages
Real Estate Platform Overview
No ratings yet
Real Estate Platform Overview
10 pages
Importance of Quantitative Research Across Fields
No ratings yet
Importance of Quantitative Research Across Fields
1 page
Marketing Management Syllabus
No ratings yet
Marketing Management Syllabus
2 pages
2.8" TFT Touchscreen: Created by Lady Ada
No ratings yet
2.8" TFT Touchscreen: Created by Lady Ada
34 pages
Adani P001 Corrosion Protection
No ratings yet
Adani P001 Corrosion Protection
119 pages
Ruxandra-Laura Boşilcă, Susana Ferreira, Barry J. Ryan - Routledge Handbook of Maritime Security (2022, Routledge) - Libgen - Li
No ratings yet
Ruxandra-Laura Boşilcă, Susana Ferreira, Barry J. Ryan - Routledge Handbook of Maritime Security (2022, Routledge) - Libgen - Li
409 pages
Students Who Work or Unemployed Students
No ratings yet
Students Who Work or Unemployed Students
2 pages

Introduction To Data Mining Assignment 2

Uploaded by

Introduction To Data Mining Assignment 2

Uploaded by

Introduction to Data Mining

Q#1: A database has five transactions. Let min-sup=60% and min-conf=80%

You might also like