pytorch
diff --git a/‎torch/distributed/_shard/sharded_tensor/__init__.py
Lines changed: 12 additions & 9 deletions b/‎torch/distributed/_shard/sharded_tensor/__init__.py
Lines changed: 12 additions & 9 deletions
@@ -1,9 +1,12 @@
-
 import functools
-from typing import List
+from typing import List, TYPE_CHECKING
 
 import torch
-import torch.distributed._shard.sharding_spec as shard_spec
+
+if TYPE_CHECKING:
+    from torch.distributed._shard.sharding_spec import ShardingSpec
+else:
+    ShardingSpec = "ShardingSpec"
 
 from .api import (
     _CUSTOM_SHARDED_OPS,
@@ -18,7 +21,7 @@
 from torch.distributed._shard.op_registry_utils import _decorator_func
 
 
-def empty(sharding_spec: shard_spec.ShardingSpec,
+def empty(sharding_spec: ShardingSpec,
           *size,
           dtype=None,
           layout=torch.strided,
@@ -70,7 +73,7 @@ def empty(sharding_spec: shard_spec.ShardingSpec,
         init_rrefs=init_rrefs,
     )
 
-def ones(sharding_spec: shard_spec.ShardingSpec,
+def ones(sharding_spec: ShardingSpec,
          *size,
          dtype=None,
          layout=torch.strided,
@@ -121,7 +124,7 @@ def ones(sharding_spec: shard_spec.ShardingSpec,
         init_rrefs=init_rrefs
     )
 
-def zeros(sharding_spec: shard_spec.ShardingSpec,
+def zeros(sharding_spec: ShardingSpec,
           *size,
           dtype=None,
           layout=torch.strided,
@@ -172,7 +175,7 @@ def zeros(sharding_spec: shard_spec.ShardingSpec,
         init_rrefs=init_rrefs
     )
 
-def full(sharding_spec: shard_spec.ShardingSpec,
+def full(sharding_spec: ShardingSpec,
          size,
          fill_value,
          *,
@@ -225,7 +228,7 @@ def full(sharding_spec: shard_spec.ShardingSpec,
     torch.nn.init.constant_(sharded_tensor, fill_value)  # type: ignore[arg-type]
     return sharded_tensor
 
-def rand(sharding_spec: shard_spec.ShardingSpec,
+def rand(sharding_spec: ShardingSpec,
          *size,
          dtype=None,
          layout=torch.strided,
@@ -278,7 +281,7 @@ def rand(sharding_spec: shard_spec.ShardingSpec,
     torch.nn.init.uniform_(sharded_tensor, 0, 1)  # type: ignore[arg-type]
     return sharded_tensor
 
-def randn(sharding_spec: shard_spec.ShardingSpec,
+def randn(sharding_spec: ShardingSpec,
           *size,
           dtype=None,
           layout=torch.strided,