Whamcloud - gitweb
b=20758 Update SLES10 kernel to 2.6.16.60-0.42.8(only patchless).
[fs/lustre-release.git] / lustre / ChangeLog
index 058c08e..01e14ed 100644 (file)
 tbd  Sun Microsystems, Inc.
        * version 2.0.0
-       * Support for kernels:
-        2.6.16.60-0.37 (SLES 10),
-        2.6.18-128.1.6.el5 (RHEL 5),
-        2.6.22.14 vanilla (kernel.org).
+       * Server support for kernels:
+         2.6.18-164.6.1.el5 (RHEL 5)
+         2.6.18-164.6.1.0.1.el5 (OEL 5)
        * Client support for unpatched kernels:
         (see http://wiki.lustre.org/index.php?title=Patchless_Client)
-        2.6.16 - 2.6.21 vanilla (kernel.org)
-       * Recommended e2fsprogs version: 1.41.5.sun2
+         2.6.18-164.6.1.el5 (RHEL 5),
+         2.6.18-164.6.1.0.1.el5 (OEL 5)
+         2.6.16.60-0.42.8 (SLES 10),
+         2.6.27.19-5 (SLES11)
+       * Recommended e2fsprogs version: 1.41.6.sun1
        * Note that reiserfs quotas are disabled on SLES 10 in this kernel.
-       * RHEL 4 and RHEL 5/SLES 10 clients behaves differently on 'cd' to a
-        removed cwd "./" (refer to Bugzilla 14399).
-       * File join has been disabled in this release, refer to Bugzilla 16929.
+
+Severity   : normal
+Bugzilla   : 21547
+Description: Add cascading_rw to lustre mpi tests.
+
+Severity   : normal
+Bugzilla   : 19964
+Description: Store SOM data in EA.
+Details    : Also several SOM related cleanups.
+
+Severity   : normal
+Bugzilla   : 20098
+Description: Add refcount to md_open_data
+
+Severity   : normal
+Bugzilla   : 20607
+Description: Use refcount on lov_request_set to prevent memory corruption.
+
+Severity   : normal
+Bugzilla   : 15692
+Description: Statahead: use parent dir's i_mutex for synchronization.
+
+Severity   : normal
+Bugzilla   : 21571
+Description: loadgen improvements.
+
+Severity   : normal
+Bugzilla   : 16186
+Description: Enable peer health detection in ksocklnd and ko2iblnd.
+
+Severity   : normal
+Bugzilla   : 17545
+Description: Control DCACHE_LUSTRE_INVALID flag with MDS_INODE_LOOKCUP lock
+
+Severity   : normal
+Bugzilla   : 21591
+Description: Fix race on obd_devcie:md_stats
+
+Severity   : normal
+Bugzilla   : 21600
+Description: Fix SLES 11 client builds.
+Details    : Resolved uninitalized pointer gcc warnings.
+
+Severity   : normal
+Bugzilla   : 21259
+Description: Allow non-root access for "lfs check".
+Details    : Added a check in obd_class_ioctl() for OBD_IOC_PING_TARGET.
+
+Severity   : normal
+Bugzilla   : 21513
+Description: Clear imp_force_reconnect correctly in ptlrpc_connect_interpret()
+
+Severity   : enhancement
+Bugzilla   : 20773
+Description: Update kernel to RHEL5.4 2.6.18-164.6.1.el5 and
+            OEL5 2.6.18-164.6.1.0.1.el5(Both in-kernel OFED enabled).
+
+Severity   : normal
+Bugzilla   : 21049
+Description: Sanity test_27p fails.
+Details    : OBD_FAIL_OST_ENOSPC has been moved to filter_statfs().
+             Sanity tests 27 were cleaned up and improved.
+
+Severity   : normal$
+Bugzilla   : 18631
+Description: Unify req format on client/servers
+Details    : Use new req_capsule API [almost] everywhere instead of old PTLRPC
+             buffers and swabbers approach..
+
+Severity   : normal
+Frequency  : cleanup
+Bugzilla   : 19200
+Description: drop join file stuff.
+
+Severity   : enhancement
+Bugzilla   : 14250
+Description: Add 2.6.27 and SLES11 (patchless client) support
+
+Severity   : normal
+Bugzilla   : 20302
+Description: Fix in ptlrpc_expire_one_request() to print the signed time
+            difference.
+
+Severity   : enhancement
+Bugzilla   : 16312
+Description: Build kernels (RHEL5, OEL5 and SLES10/11) using the vendor's own
+             kernel spec file.
+
+Severity   : enhancement
+Bugzilla   : 19662
+Description: Remove set_info(KEY_UNLINKED) from MDS/OSC
+
+Severity   : enhancement
+Bugzilla   : 19526
+Description: correctly handle big reply message.
+Details    : send LNet event if reply is bigger then buffer and adjust this buffer
+             correctly.
+
+Severity   : normal
+Bugzilla   : 19917
+Description: Drop unnecessary __GFP_NOMEMALLOC flag from filter_get_page()
+
+Severity   : enhancement
+Bugzilla   : 20539
+Description: Add support for OEL5.
+
+Severity   : normal
+Bugzilla   : 20482
+Description: Conf-sanity.sh 50g test - deactivated OST should not cause a panic.
+
+Severity   : normal
+Bugzilla   : 18674
+Description: client could not reconnect to OST because of an active request.
+Details    : The client now retries to reconnect to the same server, if a
+            connect request failed with EBUSY or -EAGAIN. Test case 35b
+            conf-sanity.sh has been created.
+
+Severity   : normal
+Bugzilla   : 19557
+Description: Don't allow make backward step on assignin osc next id.
+Details    : race between allocation next id and ll_sync thread can be cause
+             of set wrong osc next id and can be kill valid ost objects.
+
+Severity   : normal
+Bugzilla   : 20533
+Description: Changes in raid5-large-io-rhel5.patch to calculate sectors properly
+
+Severity   : normal
+Bugzilla   : 20533
+Description: Increase the default BLK_DEF_MAX_SECTORS value for RHEL5 and SLES11
+
+Severity   : normal
+Bugzilla   : 20482
+Description: Error handling in osc_statfs_interpret() has been improved.
+Details    : Check in osc_statfs_interpret() for EBADR.
+
+Severity   : normal
+Bugzilla   : 20482
+Description: Do not send statfs() requests to OSTs disabled by administrator.
+Details    : Check in lov_prep_statfs_set() for non-NULL ltd_exp.
+
+Severity   : enhancement
+Bugzilla   : 20200
+Description: Added sanity-quota test to for lfs(1) to work with numeric uid/gid.
+
+Severity   : enhancement
+Bugzilla   : 20400
+Description: Update kernel to RHEL5 2.6.18-128.7.1.el5.
+
+Severity   : enhancement
+Bugzilla   : 20200
+Description: Enhancement for lfs(1) command to use numeric uid/gid.
+
+Severity   : normal
+Bugzilla   : 14951
+Description: Improved cleanup procedure for conf-sanity test_46a.
+
+Severity   : normal 
+Bugzilla   : 18674
+Description: Do not start bulk transfer, if client tried to reconnect.
+Details    : Do not start bulk transfer, if client tried to reconnect,
+            but failed due to active rpcs. Check for exp_abort_active_req
+            has been implemented.
+
+Severity   : normal
+Bugzilla   : 19566
+Description: Prevent inconsistences between linux and lustre mount structures.
+Details    : Wait indefinitely in server_wait_finished() until mnt_count drops.
+            Make the sleep interruptible.
+
+Severity   : enhancement
+Bugzilla   : 19955
+Description: provide server to client comms path
+Details    : server to client communications path via new LDLM_SET_INFO rpc
+       
+Severity   : normal
+Bugzilla   : 20008
+Description: truncate starts GFP_FS allocation under transaction causing deadlock
+Details    : ldiskfs_truncate calls grab_cache_page which may start page
+             allocation under an open transaction. This may lead to
+             calling prune_icache with consequent lustre reentrance.
+
+Severity   : normal
+Bugzilla   : 19934
+Description: send correctly lsm on open replay
+Details    : MDS is trust to LSM size on replay open, but client can set wrong size
+             to lsm buffer.
+
+Severity   : normal
+Bugzilla   : 19854
+Description: enable client interface failover
+Details    : When a child reconnects from another NID, properly update export
+             nid hash position and ldlm reverse import.
+
+Severity   : enhancement
+Bugzilla   : 18539
+Description: Communicate OST degraded/readonly state via statfs to MDS
+Details    : Flags in the statfs returned from OSTs indicate whether the
+            OST is in a degraded RAID state, or if the filesystem has
+            turned read-only after a filesystem error is detected.
+
+Severity   : normal
+Bugzilla   : 20122
+Frequency  : rare
+Description: don't panic if EPROTO was hit when reading symlink
+Details    : correctly handling request reference in error cases.
+
+Severity   : enhancement
+Bugzilla   : 19856
+Description: Add LustreNetLink, a kernel-userspace communcation path.
+
+Severity   : enhancement
+Bugzilla   : 19847
+Description: Update kernel to SLES10 SP2 2.6.16.60-0.39.3.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18800
+Description: access to llog context before init.
+Details    : move handling CATALOGS file at osc layer and forbid access to llog
+            context before init.
+
+Severity   : normal
+Frequency  : rare, only when client is writing to OST on local node
+Bugzilla   : 19529
+Description: Avoid deadlock for local client writes
+Details    : Use new OBD_BRW_MEMALLOC flag to notify OST about writes in the
+            memory freeing context. This allows OST threads to set the
+            PF_MEMALLOC flag on task structures in order to allocate memory
+            from reserved pools and complete IO.
+            Use GFP_HIGHUSER for OST allocations for non-local client writes,
+            so that the OST threads generate memory pressure and allow
+            inactive pages to be reclaimed.
+
+Severity   : enhancement
+Bugzilla   : 19846
+Description: Update kernel to RHEL5.3 2.6.18-128.1.14.el5.
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18380
+Description: lock ordering violation between &cli->cl_sem and _lprocfs_lock
+Details    : move ldlm namespace creation in setup phase to avoid grab
+            _lprocfs_lock with cli_sem held.
+
+Severity   : normal
+Bugzilla   : 19507
+Description: Temporarily disable grant shrink.
+Details    : Disable the feature for debugging.
+
+Severity   : normal
+Frequency  : only when formatting test filesystems
+Bugzilla   : 18624
+Description: Unable to run several mkfs.lustre on loop devices at the same time
+Details    : mkfs.lustre returns error 256 on the concurrent loop devices
+            formatting. The solution is to proper handle the error.
 
 Severity   : enhancement
 Bugzilla   : 19024
@@ -22,10 +277,11 @@ Bugzilla   : 19212
 Description: Update kernel to SLES10 SP2 2.6.16.60-0.37.
 
 Severity   : normal
+Frequency  : rare
 Bugzilla   : 19528
 Description: resolve race between obd_disconnect and class_disconnect_exports
 Details    : if obd_disconnect will be called to already disconnected export he
-             forget release one reference and osc module can't unloaded.
+            forget release one reference and osc module can't unloaded.
 
 Severity   : enhancement
 Bugzilla   : 18688
@@ -36,20 +292,22 @@ Details    : For each service a new
             current number of running threads.
 
 Severity   : normal
+Frequency  : rare
 Bugzilla   : 18382
-Descriptoin: don't return error if have particaly created objects for file.
-Details    : lov_update_create_set uses set->set_success as index for created objects,
-             so if some requests will be failed, they will have hole at end of
-             array and we can use qos_shrink_lsm for allocate correct lsm.
+Descriptoin: don't return error if have partially created objects for file.
+Details    : lov_update_create_set uses set->set_success as index for created
+            objects, so if some requests will be failed, they will have hole
+            at end of array and qos_shrink_lsm for allocate correct lsm.
 
 Severity   : enhancement
 Bugzilla   : 17671
 Description: Update OFED support to 1.4.1
 
 Severity   : normal
+Frequency  : common
 Bugzilla   : 18645
 Description: Reduce small size read RPC
-Details    : Set read-ahead limite for every file and only do read-ahead when
+Details    : Set read-ahead limit for every file and only do read-ahead when
             available read-ahead pages are bigger than 1M to avoid small size
             read RPC.
 
@@ -62,7 +320,7 @@ Severity   : enhancement
 Bugzilla   : 17974
 Description: add lazystatfs mount option to allow statfs(2) to skip down OSTs
 Details    : allow skip disconnected ost for send statfs request and hide error
-             in this case.
+            in this case.
 
 Severity   : major
 Frequency  : rare
@@ -86,13 +344,13 @@ Frequency  : rare
 Bugzilla   : 18902
 Descriptoin: allow kill process which wait statahead result
 Details    : for some reasons 'ls' can stick in waiting result from statahead,
-             in this case need way for kill this process.
+            in this case need way for kill this process.
 
 Severity   : enhancement
 Bugzilla   : 18798
 Description: Add state history info file, enhance import info file
 Details    : Track import connection state changes in a new osc/mdc proc file;
-             add overview-type data to the osc/mdc import proc file.
+            add overview-type data to the osc/mdc import proc file.
 
 Severity   : enhancement
 Bugzilla   : 17536
@@ -116,31 +374,31 @@ Frequency  : start MDS on uncleanly shutdowned MDS device
 Bugzilla   : 16839
 Descriptoin: ll_sync thread stay in waiting mds<>ost recovery finished
 Details    : stay in waiting mds<>ost recovery finished produce random bugs
-             due race between two ll_sync thread for one lov target. send
-             ACTIVATE event only if connect realy finished and import have
-             FULL state.
+            due race between two ll_sync thread for one lov target. send
+            ACTIVATE event only if connect realy finished and import have
+            FULL state.
 
 Severity   : normal
 Frequency  : rare, connect and disconnect target at same time
 Bugzilla   : 17310
 Descriptoin: ASSERTION(atomic_read(&imp->imp_inflight) == 0
 Details    : don't call obd_disconnect under lov_lock. this long time
-             operation and can block ptlrpcd which answer to connect request.
+            operation and can block ptlrpcd which answer to connect request.
 
 Severity   : normal
 Frequency  : rare
 Bugzilla   : 18154
 Descriptoin: don't lose wakeup for imp_recovery_waitq
 Details    : recover_import_no_retry or invalidate_import and import_close can
-             both sleep on imp_recovery_waitq, but we was send only one wakeup
-             to sleep queue.
+            both sleep on imp_recovery_waitq, but we was send only one wakeup
+            to sleep queue.
 
 Severity   : normal
 Frequency  : always with long access acl
 Bugzilla   : 17636
 Descriptoin: mds can't pack reply with long acl.
 Details    : mds don't control size of acl but they limited by reint/getattr
-             reply buffer.
+            reply buffer.
 
 Severity   : enhancement
 Bugzilla   : 18061
@@ -161,7 +419,7 @@ Frequency  : on remount
 Bugzilla   : 18018
 Description: external journal device not working after the remount
 Details    : clear dev_rdonly flag for external journal devices in
-             blkdev_put()
+            blkdev_put()
 
 Severity   : minor
 Frequency  : rare
@@ -169,49 +427,49 @@ Bugzilla   : 17802
 Description: shutdown vs evict race
 Details    : client_disconnect_export vs connect request race.
             if client will evicted at this time - we start invalidate
-             thread without referece to import and import can be freed
-             at same time.
+            thread without referece to import and import can be freed
+            at same time.
 
 Severity   : normal
 Frequency  : rare, need acl's on inode.
 Bugzilla   : 16492
 Description: client can't handle ost additional correctly
 Details    : if ost was added after client connected to mds client can have
-             hit lnet_try_match_md ... to big messages to wide striped files.
-             in this case need teach client to handle config events about add
-             lov target and update client max ea size at that event.
+            hit lnet_try_match_md ... to big messages to wide striped files.
+            in this case need teach client to handle config events about add
+            lov target and update client max ea size at that event.
 
 Severity   : enhancement
 Bugzilla   : 15699
 Description: Changelogs
 Details    : Changelogs are a lightweight mechanism to track filesystem
-             metadata and namespace changes.  The changelog is recorded
-             permanently on the MDTs, and is periodically "consumed" / purged
-             when records are no longer needed.
+            metadata and namespace changes.  The changelog is recorded
+            permanently on the MDTs, and is periodically "consumed" / purged
+            when records are no longer needed.
 
 Severity   : enhancement
 Bugzilla   : 15957
 Description: compact fld format with extents
 Details    : Store range of seq rather than every seq in FLD. Seq
-             controller update FLD rather than clients. In Case of CMD, mdt0
-             has FLD, all other metadata server act as non persistent proxy
-             for FLD queries and cache fld entries in fld cache.
+            controller update FLD rather than clients. In Case of CMD, mdt0
+            has FLD, all other metadata server act as non persistent proxy
+            for FLD queries and cache fld entries in fld cache.
 
 Severity   : normal
 Frequency  : rare
 Bugzilla   : 16081
 Description: don't skip ost target if they assigned to file
 Details    : Drop slow OSCs if we can, but not for requested start idx.
-             This means "if OSC is slow and it is not the requested
-             start OST, then it can be skipped, otherwise skip it only
-             if it is inactive/recovering/out-of-space.
+            This means "if OSC is slow and it is not the requested
+            start OST, then it can be skipped, otherwise skip it only
+            if it is inactive/recovering/out-of-space.
 
 Severity   : normal
 Bugzilla   : 16080
 Description: more cleanup in mds_lov
 Details    : not send LOV EA under replay, we can't know about they size at this
-             time. Don't allow client connect to mds before any ost connected,
-             for avoid problems with LOV EA size and returning EIO to client.
+            time. Don't allow client connect to mds before any ost connected,
+            for avoid problems with LOV EA size and returning EIO to client.
 
 Severity   : enhancement
 Bugzilla   : 11826
@@ -2079,6 +2337,36 @@ Bugzilla   : 16823
 Description: Allow stripe size to be up to 4G-64k
 Details    : Fix math logic to allow large stripe sizes.
 
+Severity   : high
+Bugzilla   : 17569
+Description: add check for >8TB ldiskfs filesystems
+Details    : ext3-based ldiskfs does not support greater than 8TB LUNs.
+            Don't allow >8TB ldiskfs filesystems to be mounted without
+            force_over_8tb mount option
+
+Severity   : normal
+Frequency  : rare
+Bugzilla   : 18793
+Descriptoin: OSS complains "too many blocks" and crashes
+Details    : In filter_commitrw_write():
+            1. lquota_chkquota();
+            2. obdo_from_inode();
+            3. lquota_pending_commit();
+            "2." has changed uid and gid in this case, then caused
+            lquota_chkquota() and lquota_pending_commit() to use
+            different uid and gid. That is the root of the bug.
+
+Severity   : normal
+Bugzilla   : 20463
+Descriptoin: getstripe doesn't report stripe count = -1 sanely
+Details    : Detect and print out the 'stripe count = -1' case properly.
+
+Severity   : normal
+Bugzilla   : 19128
+Description: Out or order replies might be lost on replay
+Details    : In ptlrpc_retain_replayable_request if we cannot find retained
+             request with tid smaller then one currently being added, add it
+            to the start, not end of the list.
 
 --------------------------------------------------------------------------------