scikit-learn
diff --git a/‎sklearn/metrics/cluster/tests/test_unsupervised.py
Lines changed: 3 additions & 2 deletions b/‎sklearn/metrics/cluster/tests/test_unsupervised.py
Lines changed: 3 additions & 2 deletions
diff --git a/‎sklearn/metrics/cluster/unsupervised.py
Lines changed: 43 additions & 1 deletion b/‎sklearn/metrics/cluster/unsupervised.py
Lines changed: 43 additions & 1 deletion
@@ -2,7 +2,7 @@
 from scipy.sparse import csr_matrix
 
 from sklearn import datasets
-from sklearn.metrics.cluster.unsupervised import silhouette_score, silhouette_samples
+from sklearn.metrics.cluster.unsupervised import silhouette_score
 from sklearn.metrics import pairwise_distances
 from sklearn.utils.testing import assert_false
 from sklearn.utils.testing import assert_almost_equal
@@ -53,6 +53,7 @@ def test_no_nan():
     silhouette_sample = silhouette_samples([[3],[3]], np.array([2,4]))
     assert_false(np.isnan(silhouette_sample).any())
 
+
 def test_correct_labelsize():
     # Assert 1 < n_labels < n_samples
     dataset = datasets.load_iris()
@@ -86,4 +87,4 @@ def test_non_numpy_labels():
     X = dataset.data
     y = dataset.target
     assert_equal(
-        silhouette_score(list(X), list(y)), silhouette_score(X, y))
+        silhouette_score(list(X), list(y)), sil
10000
houette_score(X, y))
@@ -161,8 +161,50 @@ def silhouette_samples(X, labels, metric='euclidean', **kwds):
        <http://en.wikipedia.org/wiki/Silhouette_(clustering)>`_
 
     """
+<<<<<<< HEAD
     le = LabelEncoder()
     labels = le.fit_transform(labels)
+=======
+    distances = pairwise_distances(X, metric=metric, **kwds)
+    n = labels.shape[0]
+    A = np.array([_intra_cluster_distance(distances[i], labels, i)
+                  for i in range(n)])
+    B = np.array([_nearest_cluster_distance(distances[i], labels, i)
+                  for i in range(n)])
+    sil_samples = (B - A) / np.maximum(A, B)
+    # nan values are for clusters of size 1, and should be 0
+    return np.nan_to_num(sil_samples)
+
+
+def _intra_cluster_distance(distances_row, labels, i):
+    """Calculate the mean intra-cluster distance for sample i.
+
+    Parameters
+    ----------
+    distances_row : array, shape = [n_samples]
+        Pairwise distance matrix between sample i and each sample.
+
+    labels : array, shape = [n_samples]
+        label values for each sample
+
+    i : int
+        Sample index being calculated. It is excluded from calculation and
+        used to determine the current label
+
+    Returns
+    -------
+    a : float
+        Mean intra-cluster distance for sample i
+    """
+    mask = labels == labels[i]
+    mask[i] = False
+    if not np.any(mask):
+        # cluster of size 1
+        return 0
+    a = np.mean(distances_row[mask])
+    return a
+
+>>>>>>> reverted the comment
 
     distances = pairwise_distances(X, metric=metric, **kwds)
     unique_labels = le.classes_
@@ -200,4 +242,4 @@ def silhouette_samples(X, labels, metric='euclidean', **kwds):
 
     sil_samples = inter_clust_dists - intra_clust_dists
     sil_samples /= np.maximum(intra_clust_dists, inter_clust_dists)
-    return np.nan_to_num(sil_samples)
+    return np.nan_to_num(sil_samples)